커뮤니티
스포츠
토론장


새 잡담게시판으로 가기
(구)잡담게시판 [1] [2] [3] [4] [5] [6]
HOME > 커뮤니티 > 잡담 게시판
 
작성일 : 16-03-15 09:20
페이스북 & MS 인공지능 연구자들의 알파고에 대한 비꼼
 글쓴이 : 컵안의별
조회 : 1,281  

https://www.facebook.com/yann.lecun/posts/10153426023477143?pnref=story

Statement from a Slashdot post about the AlphaGo victory: 

"We know now that we don't need any big new breakthroughs to get to true AI"
That is completely, utterly, ridiculously wrong.

As I've said in previous statements: 
most of human and animal learning is unsupervised learning. If intelligence was a cake, unsupervised learning would be the cake, supervised learning would be the icing on the cake, and reinforcement learning would be the cherry on the cake. We know how to make the icing and the cherry, but we don't know how to make the cake.
We need to solve the unsupervised learning problem before we can even think of getting to true AI. And that's just an obstacle we know about. What about all the ones we don't know about?

페이스북의 인공지능연구소장인 얀 레쿤, 알파고의 승리에 대한 기고

"우리는 진정한 인공지능을 얻기위해 어떤 크고 새로운 획기적인 발전이 필요하지 않다는 것을 이제는 앎니다"
그것은 완전히 철저히 어처구니 없을 정도로 잘못된 것이죠.

내가 이전 기고들에서 말해왔듯이
대부분의 인간과 동물의 학습은 비지도학습입니다. 지능(a cake)이 하나의 케이크 였더라면 비지도학습(the cake)은 케이크류 일 수 있습니다. 지도학습은 케이크 위에 아이싱 일수 있고, 강화학습은 케이크 위 체리 일 수 있습니다.
우리는 아이싱과 체리를 만드는 법을 알고 있습니다만, 우리는 케이크를 만드는 법은 모릅니다.
우리가 진정한 인공지능을 얻을수 있다고 생각하기 전에 우리는 비지도 학습 문제를 해결할 필요가 있습니다.
그것이 우리가 알아야 할 단 한가지 장애물입니다. 우리가 알지 못하는 것에 대한 것은 뭔가요?

**********************

마이크로소프트 머신러닝 연구원 존 랭포드 역시 'AlphaGo is not the solution to AI'

알파고는 몬테카를로 트리서치, 패턴매칭과 강화학습이란 것을 사용합니다.

바둑 인공지능에서 흔하게 사용하는 몬테카를로 트리서치는 인간기보들에서 수집되는 행마 수순들의 기록입니다.

그런 행마수순의 기록중 잘 알려져 있는 것이 정석입니다.
인간의 기보를 수백만건 수집해서 한 바둑판에 차곡차곡 쌓아올린다고 생각해보면,
바둑이 다를 때마다 행마의 갈래가 나오고, 이런 경우에는 여길 두더라 저길 두더라 통계학적으로 집계가 가능합니다.

인간은 그 많은 정석을 다 외울수 없을 뿐더라 중반에는 행마법이란 것이 있지만 일감으로 그 착점들을 추려내고 수 읽기를 하지만,

컴퓨터는 일감이란 것이 없기에 수 많은 갈래길을 다 탐방해 봐야 하지만, 그것은 현 컴퓨터 기술로는 불가한 가지수.

그래서 몬테카를로 트리서치와 패턴매칭을 사용합니다.
인간은 이리두더라 저리두더라를 데이타베이스화 시키고 어떠한 기준에 의해 선택하는 것이죠.
안가본 길에 대한 탐색은 패턴을 분석하거나 어떤 착점에 대한 다이아몬드 반경에 있는 갖가지 경우를 일일히 두어보고 계가를 해 보겠죠.

안가본 길에 대한 탐색은 이른바 딥마인드가 밝힌 강화학습이란 것을 통해서도 합니다.
인간의 시간과는 다르게 흐르는 컴퓨터의 시간에서 컴퓨터 프로그램들이 셀 수 없는 대국을 진행시키며 데이타베이스를 늘려가는 것이죠.

대강은 이런 식인데,

이것이 얀 리쿤이 비꼬는 지점이죠.
이미 잘 알려진 방식에 구글의 엄청난 리소스 지원으로 이룩한 성과이지, 획기전인 발전도 없었고
'아직도 우리는 케이크 만드는 법을 모른다'고 비꼬는...


출처 : 해외 네티즌 반응 - 가생이닷컴https://www.gasengi.com




가생이닷컴 운영원칙
알림:공격적인 댓글이나 욕설, 인종차별적인 글, 무분별한 특정국가 비난글등 절대 삼가 바랍니다.
Banff 16-03-15 09:30
   
얀 리쿤이 저커버그에게 꾸사리 먹었다는 소문도 있고.  그냥 다 루머에요. ㅎㅎ  어차피 엔지니어들은 정치인들처럼 설왕설래할 필요 없고, 그냥 결과로 보여주면 됩니다.
     
컵안의별 16-03-15 09:33
   
얀 리쿤이 직접 올린 올린 글입니다.
          
Banff 16-03-15 09:47
   
http://www.businessinsider.com/mark-zuckerberg-congratulates-google-for-ai-go-victory-2016-3
Mark Zuckerberg congratulates Google for its 'historic milestone in AI research'
FAIR head Yann LeCun today also offered congratulatory words to Google.
               
컵안의별 16-03-15 09:56
   
바둑이란 게임이 호락호락하지 않아 어떤 방식이든 프로를 호선으로 꺾은 적이 없으니, 그 부분은 축하하지만 구현방식에 대해 지적하는 것 아닙니까?

링크에 기사날짜와 얀리쿤이 올린 시간을 보세요. 축하 먼저 비평은 그 후.
          
Banff 16-03-15 09:53
   
그리고 링크다신 리쿤의 글은 weak AI인 알파고에 대한 얘기가 아니라 자율의지가 있는 strong AI에 대한 얘기이지, 알파고를 비꼬는 글은 아니에요.  어제 브린의 인터뷰보니 strong AI는 불가능한걸로 본다고 했던데.. 그건 알파고와 전혀 다른 얘기에요.  이 동네가 그리 치사한 동네는 아닙니다. ㅎㅎ
archwave 16-03-15 10:04
   
학문적 비평은 비꼼과는 다른겁니다.

이론이나 구현 등에 대해 그 이론/구현은 어떤 한계가 있다라고 문제 제기하는 것이고요.

Banff 님이 이미 말씀하셨지만, 바둑에 한해 하는 얘기가 아니고 바둑과 그 외 유사 문제 해결에는 좋은 방법이지만, AI 에 대한 해답 ( 만병통치약 ? ) 은 될 수 없다는 얘기인거죠.
컵안의별 16-03-15 10:11
   
영문은 제가 적은 것이 아니고 얀리쿤이 적은 것임을 먼저 말씀드립니다.
처음 2 문장 비평인지 비꼼인지 구분이 애매(?)하군요.

아크웨이브님은 저 구현법을 컴퓨터 직관으로 인식하셨는데,
직관이란 것은 특별한 문제에 대한 잘 조율된 접급법이던가요?
저는 저것은 직관이 아닌 잘 조율된 노가다로 보입니다.
     
archwave 16-03-15 10:21
   
저는 직관이란 것을 지능과는 별개의 것으로 봅니다.

마침 알파고의 직관에 대한 제 생각을 http://www.gasengi.com/main/board.php?bo_table=commu07&wr_id=1014257 여기에 적었었고요.

위 글의 의미가 조금 애매하긴 한데, 알파고의 경우 지도학습을 쓰지 않았습니다. 지도하지 않고 그냥 엄청난 기보를 던져주고 독학하라고 한 것이죠. 즉 비지도학습임.

엄청난 리소스 지원으로 이룩한 성과 ---- 이건 비지도학습인 경우 당연한겁니다. 지도하지 않고 스스로 배우게 만들려면 뭐가 되었든 마구 퍼부어줘야죠.

노가다는 사람이 한게 아니고, 기계가 한거죠. 퍼부어준 엄청난 양의 데이타를 노가다스런 작업을 통해 독학.

사람이 직관을 가지는 것도 뭐 별다를거 없죠. 수많은 시행착오 격고 공부해서 얻어지는 것이죠.

하다 못 해 애기들은 뭐든지 입에 넣어보죠. 그러면서 먹을 수 있는 것과 없는 것을 구별하는 요령을 스스로 익히고 그 뒤로는 뭐든 보면 먹을 수 있는거 없는거 가리는 [ 직관 ] 을 가지게 되는 것.
          
컵안의별 16-03-15 10:30
   
알파고는 비지도학습이 아닙니다.
잘 조율된 지도에 의해 구축된 정책망이 행마를 선택하고 가치망이 계가하며 승률을 평가하죠.
그리고 제가 말한 노가다 개념역시 컴퓨터가 수행하는 트리탐방이 리소스 없이는 불가한 '조율된 노가다'라는 의미입니다.
archwave 16-03-15 10:12
   
그건 그렇고 오늘로 알파고와 벌이는 대국을 보는 것도 오늘로 마지막이네요.

오랜만에 정말 흥미진진하게 잘 봤구만..
     
컵안의별 16-03-15 10:15
   
그러게요. 오늘도 저녁에 뵈요.