지난 4월 15일 금요일 코엑스에서 열린 AI EXPO를 다녀왔다.
최근에 듣는 과목도 죄다 AI다 보니, 실제 산업 현장도 제대로 보는 것도 중요한 것 같아 둘러보게되었다.
참가자들의 규모가 작았다.
하긴, 엑스포는 늘 자신의 물건을 팔러고 나온 격식있는 시장인 것을 까먹으면 안된다.
구글이나 삼성이 굳이 코엑스 전시장 3층까지 올라와서 자신의 기술력을 자랑하고 판매할 필요는 없다.
아무튼 그렇다보니 대부분의 사람들이 접하게되는 상위 1%가 아닌 하위 99%들의 모습을 볼 수 있어서
초중고 시절까지만 해도 자신들이 ‘서울대 갈 수 있어, 삼성 취업할 수 있어’ 이런 소리를 하는
근거 없는 자신감에 취해있는 사람들에게 유의미한 충격을 줄 수 있는 것이 EXPO다.
…
잠깐이라도 생각해보면 너무나 당연한 것이
무언가를 과시하는 것은 새로 나왔거나, 존재감을 알리거나, 기존의 인식을 바꾸거나, 등등…
전통적인 강자와 기득권층에서 잘 하지 않는 것이다.
또는 위력을 과시하기 위한, 말하지 않는 공포감이 존재하지 않기 때문에 과시하는 측면이 있다.
무서운 소리를 내고, 이상한 털이 솟아있는 동식물들은 자신이 강하기 때문에 과시하는 것이 아니라
약하거나, 무지로 인해 뭔지 모를 대상에게 위협하는 것이다.
마찬가지로 굴직한 대기업은 단순히 상품 홍보를 위해서 엑스포에 나올 뿐,
그 명성은 이미 널리 알려져있다는 점이다.
…
미리 결론을 말하자면 AI 산업계는 이미 기존의 제조업과 같은 구조로 피라미드형 체계가 잡혀있다는 점이다.
무슨 말이냐하면
학습을 위한 데이터를 확보하고 처리하고 가공하는 n차 하청받는 데이터 생산 업체가 있고
그걸 상품으로 만드는 대기업이 나뉘어 있는 것처럼 분업화가 이미 많이 진행되었다는 점이다.
뭔가 벌써부터 글에서 암울해보일 수 있지만,
AI 데이터 산업 분야가 어떻게 펼쳐질 것인지에 대한 것을 살펴보자.
보편화된 데이터 처리
잘 알려진 텍스트 처리, 이미지 처리
전시에 나온 업체 대부분 똑같았다.
내가 모르기 때문에 다 비슷비슷해보이는 착각을 할 수 있지만,
글쎄, 대부분 업체는 학습용 데이터를 위해서 전처리하는 업체가 만
아직은 한정적인 원천 데이터 확보
죄다 길, 사람, 영상, 기존 산업에서 확보하기 쉬운 데이터만 있다.
이제는 전처리 기술에 확보하는 것이 중요한 것이 아니라
데이터의 다양성, 즉 데이터를 수평적으로 더 확보해야한다는 것이다.
이번 엑스포에서는 늘 보던 영상, 텍스트 마이닝 제품 외에 가장 기억에 남았던 것은
소 가축 영상 AI와 돼지 농장 AI다.
이런 AI를 개발하기 위한 데이터는 먼저 해결하고자 하는 문제의 도메인의 전문가가 필요하다.
만약에 닭 농장을 위한 AI를 만든다고 하면 누가 가장 중요할까?
당연히 닭을 기르고 농장을 운영한 사람이 제일 중요하다.
문제를 해결하기 위한 목적, 그리고 기본적으로 문제 해결하기 위한 첫 단계에 진입할 수 있기 때문이다.
너무 당연한 것인데, 일단 데이터만 있고 단순히 파이썬 스크립트 몇 줄 찍찍 쓰면 모든 문제가 해결되는 줄 아는 바보들이 많다.
엑스포에서 봤던 데이터들 대부분은 자동차과 사람 둘 중 하나로 상당히 제한적이었다.
물론 데이터를 확보하는데 들이는 비용은 엄청나게 크고,
또 그 데이터를 확보하고 도메인 전문가들이 달라붙어 문제 해결을 하기 위한 프로그램을 개발한다고
그 서비스를 구매할 수 있는 사람들이 충분히 있을지 모른다(구매력이 충분한 대상일지는 모른다).
그래서 자연스럽게 글로벌 시장으로 대상으로 확보할 수 있어야한다.
그래서 도메인 문제를 해결하기 위해서 단순히 도메인 전문가 뿐만 아니라 데이터 분석자들이 함께 달라 붙어
어떤 데이터를 추상화하고 일반화해야 세계 어느나라를 갖다 붙여도 쓸 수 있는지 만들게 된다.
마무리
엑스포를 내내 둘러보면서 느낀점은 앞서 말했지만
일반 자동차 제조업처럼 본청과 하청업체로 나뉘어 몸으로 뛰어서 데이터를 확보하는 구조가 잘 잡혀있다는 것이다.
하지만 이것도 한정적인 것이 플렛폼을 통해서 가공할 데이터가 척척 쌓이는 대기업이 더 유리하다는 점이다.
중소기업은 직접 몸으로 뛰어야하는 데이터 확보 방법이 더 활성화 될 것이다.
자연스럽게 AI 때문에 일자리가 줄어든다는 말은 없어질 것이다.
데이터 확보를 위한 IT 인프라와 자동화 시장이 더 커지면서
일반인들이 AI 산업분야는 편하게 앉아 분석만한다는 인식은 원본 데이터를 지속적으로 확보하기 위한 ‘노가다가 어느정도 첨부된’ 업종으로 인식이 바뀔 것이라 예상한다.
지금은 크게 관심이 없거나 데이터가 많이 쌓이지 않았던 분야의 데이터들
또는 데이터는 많지만 해당 분야의 전문가(도메인 전문가)들이 빅데이터와 머신러닝에 대한 이해를 하기 시작하면서
직접 구현하거나 시장을 선점하는 스타트업이 늘어날 것으로 예상한다.
즉, 현재는 자율주행과 객체인식 그리고 대체로 도시 지역의, IT 기업 주변의, 대기업 중심의 머신러닝이 수직적으로 고도화되면서 발전한 것과 반대로
수평적으로 다양한 분야에서 머신러닝이 적용될 것이며, 이것이 니셰(niche) 마켓이 될지 아니면
그동안 몰랐던 거대한 시장으로 갈지는 아무도 모른다.
마치 비디오 대여업을 하던 넷플릭스가 거대기업으로 커진것처럼
.