초당 10¹² 처리하는 칩이 바꿔놓을 세상을 말하다
구글·MS 인재 전쟁의 주인공
서울 AI팀 답사 위해 최근 방한
네이버, AI 대화 엿들어 물의
사생활 침해 막을 대안도 공개
구글로 옮긴 후 ‘머신 인텔리전스 리서치팀’을 이끌어온 그가 지난달 서울에 왔다. MS에 안착하기 1년 전인 2005년, 그러니까 삼성전자로부터 포토신스 투자 제안을 거절당해 빈손으로 돌아간 지 14년만의 재방문이었다. 그땐 직원을 열 손가락만으로도 충분히 다 셀 수 있는 작은 스타트업(Seadragon) 창업자에 불과했지만 이젠 500명 넘는 팀원을 둔 거물이 됐다. 그래서 지난달 서울에서 그를 만났을 때 처음 든 궁금증은, 이런 거물이 지금 한국에 왜 왔을까, 라는 것이었다.
의구심을 풀기 위해선 2박 3일의 짧은 일정 동안 그가 소화한 빡빡한 스케줄을 꼼꼼히 살펴봐야 한다. 이미 수차례의 TED강연을 통해 그의 또 다른 재능인 연설 솜씨를 각인시켰던 대중강연이나 IT전문지와의 기자회견 등 공개행사도 많았지만 사실 외부에 드러나지 않은 더 중요한 일정은 따로 있었다. 서울에 그의 인공지능(AI)팀을 별도로 두기 위한 사전답사였다.
구글, 아니 아게라 이 아카스가 2013년 8년간 몸담았던 MS를 떠나 왜 구글로 갔는지, 그리고 지금까지 무엇을 해왔는지에 그 답이 있다. 키워드는 바로 스마트폰, 보다 정확히 말하면 ‘온 디바이스 AI’다. 지금까지는 AI 학습을 위해 빅데이터를 클라우드(데이터센터)로 보내 모았지만 앞으로는 이용자의 개별 단말기(스마트폰) 안에서 학습이 이뤄진다는 얘기다. 그는 이 연구를 위해 고심 끝에 전 세계 모바일 시장의 4분의 3을 점유한 구글에 제 발로 갔다.
구글 검색을 하고, 페이스북에 ‘좋아요’를 달고, 넷플릭스 영화를 보고, 아마존에서 온라인 쇼핑을 하고…. 거대 테크 기업들은 수십억 사용자의 이 모든 방대한 흔적(빅데이터)을 독자적인 자체 데이터센터(클라우드)에 끌어모은 후 AI 학습에 활용해왔다. 회사마다 어마어마한 데이터센터 서버를 구축해야 했을 뿐만 아니라 데이터가 오가는 과정에서 해킹 등 개인정보 침해 문제가 발생할 우려가 컸던 게 사실이다. 해킹이 아닌 테크 회사의 데이터 남용도 걱정거리다.
결코 기우가 아니다. 최근 네이버의 AI스피커 클로버 사례만 봐도 알 수 있다. 이용자와 클로버와의 대화를 녹음한 후 이를 협력사 계약직 직원들이 수작업으로 입력하는 작업을 해왔다는 게 드러나 물의를 빚었다. 내 은밀한 목소리를 그동안 기계가 아닌 사람이 듣고 문자로 옮겨 적었다는 얘기다. 네이버는 “음성인식 수준을 끌어올려 더 좋은 서비스를 하려면 불가피하다”고 변명했다. 백번 양보해 프라이버시 침해 의도가 없었던 게 사실이라 하더라도 네이버의 AI 스피커 품질 향상을 위해 이용자의 프라이버시쯤은 침해당해도 되는 것인지 묻지 않을 수 없다.
아게라 이 아카스가 이번 방한에서 한국에 처음 소개한 ‘연합학습’은 이런 질문에 대한 구글식 해답이다. 온 디바이스 AI 개념에 충실하게, 음성 같은 데이터를 데이터센터로 보내는 게 아니라 개별 디바이스 안에 그대로 둔 채 AI학습에 활용하는 방식이다. 내 스마트폰이 데이터센터의 수퍼컴퓨터 역할을 한다고 생각하면 된다. 기존 퍼스털 컴퓨터의 CPU칩이나 게임·그래픽 처리를 위한 GPU 외에 스마트폰이 이같은 기능을 제대로 구동하려면 처리 속도가 보다 빠른 NPU(신경망처리장치)가 필요하다. 삼성전자 등 반도체 회사들이 개발에 한창인데 구글은 이미 엣지(Edge) TPU를 선보였다. 1센트 동전보다 훨씬 작은 크기지만 현재 한글로는 표현할 수 있는 단어조차 없는 속도인 3 테라옵(teraops), 그러니까 1초당 10¹²의 데이터를 처리하면서 고작 1와트의 에너지밖에 소모하지 않는 칩이다.
스마트폰에 이 칩이 심어지면 어떤 일이 벌어질까. 클로버 같은 이용자 음성 데이터의 수동 축적이 불필요하다. 이용자는 평소처럼 스마트폰을 이용하고, 충전하는 동안 이 정보가 암호화 과정을 거쳐 업데이트된 후 다시 개별 디바이스에 뿌려진다. 대화 내용 같은 개인의 사적 데이터가 아니라 학습된 내용만 공유되기 때문에 중간에 해킹돼도 개인정보 유출이나 악용을 막을 수 있다.
클라우드를 활용할 때 발생하는 트래픽 폭증과 에너지 소모 문제도 해결할 수 있다. 다시 말해 구동 속도는 더욱 빨라지고 전력 소비량은 크게 감소한다. 개별 디바이스에서 데이터센터로 데이터를 멀리 이동시킬 필요 없이 단말기 안의 칩(엣지TPU) 안에서 모든 처리가 이뤄지기에 속도가 훨씬 빠르다.
통상 데이터센터의 서버를 구축하는 것도 큰돈이 들지만 이보다는 데이터가 오가는 과정에서 드는 비용이 더 크다. 그런데 스마트폰 칩 안에서 데이터가 왔다 갔다 하니 이런 비용이 뚝 떨어진다. 또 데이터를 이동시키는 대신 바로 연산처리를 하기에 에너지 소모도 줄어든다. 환경문제까지 동시에 해결할 수 있는 셈이다.
그가 이번에 한국을 선택한 이유도 비슷한 맥락이다. 미국 퓨 리서치에 따르면 한국의 스마트폰 보유율은 95%로 2위인 이스라엘(88%)과도 격차가 크다. 이런 세계 최고의 스마트폰 보급률을 자랑하는 한국이니만큼 온 디바이스 AI연구에 매력적일 수밖에 없다.
아게라 이 아카스는 의외로 한국의 AI 수준을 매우 높게 평가했다. 그는 “우리 팀 안에도 한국 출신이 꽤 많이 있는데 다들 획기적으로 뛰어난 역량을 발휘하고 있다”며 “한국 연구자들의 논문은 기여도가 매우 높다”고 했다. 또 “한국은 AI에서 뒤처지기는커녕 면적이나 인구 대비 업적은 대단히 앞서 있다”고 평가했다. 이번의 짧은 일정 속에서도 카이스트 연구자들을 따로 만나기도 했다.
그런데 이 말에 기분이 좋기보다 걱정이 앞선 것도 사실이다. 역설적으로 구글이 그런 인재를 많이 확보했다는 건 우리가 제대로 활용을 못 하고 있다는 얘기 같아서 말이다.
안혜리 논설위원