카테고리 없음

3년후, A.I 초격차 [독서]

giung 2020. 12. 31. 14:45

이미 시작된 인공지능의 시대

-인류 역사의 거대한 변화

1. 언어의 탄생

2. 농업혁명

3. 산업혁명

다음 산업의 변화는 이제 막 시작된 4차 산업혁명이다. 3차 산업혁명 시대는 세상을 자동화하는 시대였다. 하지만 4차 산업혁명은 a.i가 세상을 이해하는 시대이다. 데이터는 80% 이상이 보이지 않고, 내용을 사람이 알지도 못한다. 대신 컴퓨터가 수 많은 양의 데이터를 이해하게 되면서 문제에 대한 해결책을 스스로 찾아가게 되었다.

-부의 이동이 시작

4차 산업혁명 시대에는 시장에서의 수익률이 거듭제곱 법칙을 따르게 될 것이다. 쉽게 말하자면 기술이 고도될수록 시장의 부가 극소수의 기업 및 기술 권력자에게 흡수된다는 이야기이다. 과거 공업이 발달할 시기에는 노동자본이 부를 창출했다. 노동자가 많은 회사가 더 많은 수익을 거두었고, 부동산 등 자산 소유 자체가 부를 창출하였다. 하지만 이제는 SW가 노동을 대체하면서 노동의 가치는 점점 소멸될 것이고, 투자 목적의 자산 소유가 무의미해진다. 4차 산업혁명의 희소자원은 기술자본 이며, 그 핵심에는 인공지능이 있다.

-인공지능이 발전하게된 3가지 배경

 

1. 데이터의 폭발

최근 1년간 생성된 데이터의 양이 과거 100년 동안 생성된 것 보다 많다. 데이터의 폭발로 인해 정화된 데이터가 있는 반면 정화되지 않은 데이터도 수부룩하게 있다. 이러한 데이터를 선별하는 능력 또한 중요하게 될 것이다. 그리고 인공지능이 기술적으로 하드웨어적으로 완벽하다고 해도 인공지능을 학습시킬 충분한 데이터가 없으면 쓸모가 없기 때문에 애플, 아마존, 테슬라, 마이크로소프트 같이 빅테이터를 쥐고 있는 공룡기업들이 유리할 수 밖에 없다.

2. 알고리즘의 발전

아마존의 알렉사 소통능력, 예측을 통한 유통혁명, 자율주행 기술의 발전 모두 알고리즘의 발전과 맥을 같이한다. 최근 딥러닝 알고리즘의 발전으로 예측 정확성이 비약적으로 향상되었다.

blog.naver.com/giung0408/222101345571

3. 컴퓨팅 능력의 향상

대용량의 연산처리를 가능케 하는 그래픽 프로세서(GPU)가 지속적인 발전을 이루고 있다. 2018년 출시된 GPU는 5년 전 출시된 가장 빠른 버전보다 40~80배 더 빠르다. 이로 인해 인공지능 알고리즘이 대용량의 데이터를 학습하고 해석하는 능력이 월등히 향상되었다. 이렇게 하드웨어 기술은 인공지능 기술을 향상시키고, 인공지능 기술은 보다 효율적으로 연산할 수 있는 길로 하드웨어 기술을 이끈다. 여기에 클라우드 컴퓨팅과 데이터 저장 기술, 사물인터넷 기술이 결합되고있다. 이처럼 다양한 기술이 상호보완적으로 발전하면서 시너지 효과가 더욱 커지는 것이다.

A.I 기술이란 무엇인가?

-A.I는 머신러닝으로 통한다

머신러닝: 기계와 학습의 합성어이다. 즉, 기계가 특정 논리에 맞춰 방대한 데이터를 학습한 뒤 이를 기반으로 알고리즘을 찾아내어 변화를 예측하는 것이다. 상황을 관찰하고 이해하고 평가하고 최적의 행동을 결정하는 생각의 기술이 바로 머신러닝이다.

딥러닝: 딥러닝은 머신러닝을 구현하는 기술 중 하나이다.인간이 사물을 구분하듯 데이터 속에서 패턴을 발견하고 분류를 통해 예측한다. '딥'은 사람의 뇌세포를 모방한 인공신경망이 여러 개의 층으로 구성되었다는 의미이며, 이 두뇌 작용의 프로세스를 본떠서 기계가 스스로 데이터를 분석하고 답을 낸다.

-딥러닝의 적합한 용도

 

1. 하드웨어적 기반

많은 연산을 병렬적으로 수행하기에 적합한 GPU가 주로 사용되었기 때문에 엔비디아의 주가가 최근 3년 사이에 열 배 정도 오르는데 큰 기여를 했다.

출처: 구글

2. 소프트웨어적 기반

구글은 2016년 딥러닝 패키지인 텐서플로 같은 소프트웨어가 주류에서 딥러닝이 급속도로 채택되고 이용될 수 있었던 원동력이다.텐서플로 덕분에 딥러닝의 수요는 최근 5년 동안 폭발적으로 증가하였다. 텐서플로의 기반은 파이썬으로써 데이터처리에 있어 특화되어있다.

3. 어텐션 메커니즘

국내 인공지능 전문가 중 한 명인 조경현 교수는 알고리즘의 정확성을 높이는 데 있어서 어텐션 메커니즘이 중요하다고 설명한다. 번역 알고리즘에서 어절과 어정의 관계까지 파악해야 번역이 가능한데, 어느 대목에 집중하는지에 따라 이후 프로세스의 정확도가 달라진다. 즉, 어느 부분이 중요한지를 스스로 파악해내는 집중의 정확도가 결과의 수준을 결정하는 것이다.

4. 데이터 확보

딥러닝 기술의 완성도는 결국 다양한 상황의 데이터 확보에 의해 좌우될 것이다. 최근 콤마닷에이아이나 테슬라 같은 기업이 수억 킬로미터에 달하는 주행 데이터를 수집하는 이유이다. 과거 자율주행 기술의 핵심은 자본이었다면, 지금부터는 데이터와 시간의 싸움이다. 데이터를 확보한 기업과 그러지 못한 기업의 격차는 매우 클 것으로 예상된다. 따라서 당연히 다양하고 많은 데이터를 축적한 apple, amazon, tsla, microsoft 같은 공룡기업들이 인공지능에 선두주자 일 수 밖에 없다.

-AI기술의 취약점

1.데이터 의존도

추후에 인공진능의 경쟁력은 데이터의 양과 질에 있을 것이다. 인공지능에게 데이터란 책과 같은 것이다. 아무리 하드웨어가 좋아도 가공할 데이터가 없으면 인공진능의 성능 대비 결과물은 처참할 수 밖에 없다.

2. 데이터의 편향성

아마존에서 머신러닝으로 구직자 지원서를 5만여개 키워드를 분석한 결과 경력이 10년 이상의 남성 지원자만 고른다. 그 동안 남성 지원자가 압도적으로 많았기 때문이다. 데이터 자체가 편향되어 있으면 인공지능 또한 편향 될 수 밖에 없다.

3. 인간의 노동 필요

현재 인공지능의 수준은 ANI로 아직까지는 인간이 데이터를 가공하여 주입시켜 주어야 한다.

4. 결과를 설명할 수 없다

인공지능이 결과물을 내면 어떤 원리로 그런 결과를 냈는지 엔지니어 조차 알지 못한다. 그동안 보여준 성능을 믿고 맡기는 것이다. 가장 진보된 과학이지만 상당히 과학적이지 않은 아이러니한 상황이다. 데이터의 편향성도 처리 과정이 이처럼 '깜깜이' 방식이기 때문이다. 그래서 앨론 머스크가 고안한 것이 바로 뉴럴링크이다. 뉴럴링크는 BMI기술로, 인간의 능력을 인공지능처럼 올리는 기술이다. 우리가 1시간 동안 할 대화를 인공지능은 단 1분이면 서로 주고 받을 수 있다. 그저 우리는 인공지능의 사고방식을 이해하지 못하고 결과만 수긍하는 상황에 도달하고 결국은 인공지능에 전적으로 종속되는 삶을 살 수 도있다.