X선생의 과학레시피
2024년 08월호 AI 데이터 고갈 위기에 ‘전향적으로’ 대처하는 자세 | 핵의학분과 세부편집장, 핵의학 과장 변병현 | 2024-08-02 |
---|
최근 수년 사이에 전 세계 과학기술계에서 가장 큰 관심을 받은 분야는 ‘인공지능(AI)’이 아닐까 한다. G2라고 불리는 미국과 중국은 AI 기술에서 앞서기 위해 냉전시대의 군비경쟁을 연상시키는 천문학적인 투자를 국가 차원에서 쏟아붓고 있고, 주식시장에서는 AI의 연산에 필요한 GPU 공급업체들, 관련 알고리즘을 개발하는 회사들, 이 과정에 투입되는 엄청난 전력소요와 전력망에 연관된 업체들의 주가가 끝도 없이 오르고 있다.
그런데, 세상을 근본적으로 바꾸고 인간의 능력을 아득하게 뛰어넘을 것이라고 기대되던 AI기술에 대해 최근 들어서 그 한계를 지적하는 사람들이 늘어나고 있다. 주된 요지는, ‘ChatGPT는 사람과 비슷하게 대화하고, 기존의 지식을 빠르게 요약해서 알려준다. 그런데, 은행, 관광, 식당, 관공서, 병원 등등. 어느 곳에서도 AI가 사람을 완전히 대체하고 있는 곳은 없다. 그리고, 이들 분야에서 AI가 인간을 완전히 대체하는 것이 근미래에는 불가능하다’는 것이다.
AI가 근미래에 인간을 대체하는 것이 불가능할 것으로 보는 이유는 크게 2가지이다.
따라잡기에는 너무 뛰어난 인간의 두뇌
1) 인간의 두뇌에 비해 현존하는 컴퓨터의 정보처리 기능은 너무나도 비효율적이고 느리다. 인간 뇌의 뉴런에서 정보전달속도는 현재의 최신 PC보다 25,000배 빠르고, 전력당 메모리 용량은 2,000배 많고, 뉴런 간의 네트워크 숫자는 무려 156억배 많다. 적어도 AI 기술에 핵심적으로 필요한 기능에 있어서는, 최신 PC조차 인간의 뇌와 비교하면 초보적인 수준에 불과하다고 할 수 있는 것이다. 물론, GPU나 AI 알고리즘이 빠르게 발전하고 있어서 그 간격을 좁히고 있긴 하지만 아직까지는 양자역학이 지배하는 미시세계에 대한 기술적인 장벽이 존재하므로, 근미래에 하드웨어적으로 인간의 뇌를 완벽하게 추월하는 것이 회의적이라는 것이다.
AI가 공부할 자료가 바닥났어요
2) 두번째 이유는 좀 더 심각한 이유라고 할 수 있는데, AI가 학습하기 위한 데이터의 총량이 한계에 왔다는 점이다. AI가 학습하는 정보는 지난 수십년간 인류가 인터넷 상에 저장해 놓은 데이터인데, 여기에는 수천년 전 창작된 길가메시 서사시부터 불과 몇 달 전 우리 중 누군가가 SNS에 올려놓은 글도 포함된다. 이 데이터는 그 증가속도가 미미한데 비해 기업들이 개발한 AI소프트웨어의 학습속도는 이보다 아득하게 빠르기 때문에, 빠르면 2026년, 늦어도 2030년이면 인터넷 상에는 더 이상 AI가 학습할 데이터가 남아 있지 않을 것이라고 한다. 그런데, 이렇게 AI가 현존하는 모든 인터넷 상의 데이터를 고갈될 때까지 학습하더라도 그 총량이 평균적인 인간이 25세까지 학습하는 데이터량의 2%가 채 되지 않는다고 하니, 엄청나게 방대해 보이는 인터넷 상의 누적된 데이터이지만 인간이 평생 경험하는 ‘실전데이터’에 비하면 터무니없이 작은 수준이라 할 수 있다.
AI 데이터 고갈 위기를 극복하기 위해서는?
앞서 살펴본 2개의 이유 중 1)번의 하드웨어적 한계문제는 시간이 걸리더라도 결국에는 해결될 수 있을 것으로 보인다. 하지만 2)번의 데이터 고갈문제는 완전히 새로운 접근방법이 없다면 해결이 어려운 일이다. 기존의 데이터를 재가공하거나 정제하여 AI의 학습재료를 늘리는 것도 시도되고 있으나 근본적인 해결책은 아니고, 결국에는 인터넷 상의 정보를 넘어서 시간이 걸리더라도 인간이 평생을 살면서 현실세계에서 경험하는 ‘상호작용하고 변화하는’ 데이터들을 ‘전향적’으로 수집하여 AI가 학습하는 것이 필요할 것이다.
의료AI기술에서도 마찬가지이다. AI가 이미 구해진 후향적 데이터로 학습하는 것은 그 한계가 명확할 것으로 예상할 수 있다. 흉부 X-ray와 같이 비교적 단순하고 고려할 제반 사항이 많지 않은 경우에는 AI가 훌륭한 역할을 할 수 있겠지만, 이보다 훨씬 복잡한 전신 3D영상은 함께 촬영한 다른 영상소견이나 임상경과 등을 고려하지 않고는 올바른 판독을 할 수 없다. 여기에 영상이나 각종 검사결과와 환자 상태 등을 종합하여 환자의 진료에서 의사결정을 하기 위해서는 고려해야 할 변수가 훨씬 더 많아지게 될 것이다. 이러한 고려 요소들은 기존의 의료기록에는 모두 반영되어 있지는 않은 경우가 많고, 이 점이 의료AI기술이 아직까지 의사를 대체하지 못하고 있는 이유라고 할 수 있다.
한 명의 의사가 스스로 환자를 진료할 수 있을 때까지 의과대학 강의실에 앉아서 잘 정리된 책으로 공부하는 과정이 AI가 기존 데이터로 학습하는 것이라고 한다면, 전공의 과정을 거치면서 수많은 환자, 보호자, 동료 선후배 의사들과 소통하고 오류를 겪고 보완해가는 과정은 기존 데이터를 학습한 AI가 ‘상호작용하고 변화하는 전향적 의료정보’를 학습하여 스스로 판단을 할 수 있는 진정한 AI가 되어가는 과정이라고 볼 수 있다. 따라서, 의료 AI기술이 한 단계 더 도약하기 위해서는, 국가적인 차원에서 AI연구자들이 개인정보를 안전하게 보호하면서도 대규모의 전향적 의료정보를 활용할 수 있도록 지원하는 노력이 필요하다.
- 덧글달기
- 이전글 무질서를 질서로 돌리는 방법
- 다음글 의료인프라의 붕괴함수