블록체인

블록체인이라는 이름의 지옥 (부제 : ML은 전기양이긴했냐)

「딥러닝 레볼루션이라는 책을 읽다가 빡이 좀 많이 쳐서 글을 쓰게 되었지만 서두부터 쌍욕을 날리기는 좀 뭐해서 다른 주제로 이야기를 시작한다. Bengi (혹은 필자?)의 주력 필드는 무엇이었는가에 대해 궁금한 사람들이 많을 것이다. 한 때는 NLP나 영상처리를 하고 있지를 않나, 한 때는 해킹 중에서 리버싱이랑 IoT 관련한 쪽을 하지 않나, 임베디드를 했었다고 하지 않나... 여튼 다양한 걸 하고 도대체 전공이 무엇인지에 대해서 물어본다면, 사실 나도 잘 모르는 게 사실이다. 200n년부터 블로그를 쭉 구독해왔다면 생각 없는 초중딩(...)이 해킹하겠다고 설쳤고, 게임 리버싱을 했었고, CPU를 만들겠다고 뻘짓을 했었던 흔적들을 볼 수 있을 것이다. 그리고, 으레 AI를 하고 싶어서 그 당시에는 ML인지도 모르고 ML를 하고 있었기도 했고 이런 경험들이 쌓여서, 학부를 괜찮은데를 가서 학부 2학년에 영상처리 배우고, BoB 초창기 기수에 임베디드 해킹을 주로 했었고, 그 이후에 졸업 프로젝트로 NLP 위주로 재현도 높은 논문 분류기를 만들어서 검색 및 클러스터링을 주로 했었다. 거의 검색 엔진 하나 새로 만드는 느낌이었는데, 그 때 배운게 많다.

뭐, 그래서 블록체인이라는 이름의 지옥이라는 제목은 왜 썼냐고? 사실 블록체인이 기존의 인공지능이나 컴퓨터 공학이 받았던 천대를 똑같이 받고 있다는 점과, 그리고 솔직히 블록체인 까는 인간들에 대해서 한 이야기를 하고 싶기 때문이다.

시작으로 돌아가자, 「딥러닝 레볼루션이다. 그렇게 주변 프로그래머들에게 추천을 받고, 사람들도 좋다고 하고, 필독서라고 하는데, 솔직히 읽다가 구역질이 나오는 건 둘째치고, 사실 인공지능을 공부했거나 ML을 공부했다면, 솔직히 이게 얼마나 개소리로 시작해서 개소리로 끝나는가에 대해서 생각을 할 수 있을 것이다. 아니, 사실 좀 더 이야기를 해보자면, 딥러닝과 ML은 분명히 다른 분야이며, 인공지능을 상위로 두고 있는 다른 분야라고 할 정도로 많은 차이점을 갖고 있지 않나 싶다. 실제로 많은 분야에서 딥러닝 연구자들은 기존 인공지능이나 ML 연구자들과는 다른 분야를 사는 듯한 느낌을 많이 받는데, 이 부분은 일반적으로 사용하는 툴과 공부하는 백그라운드에서 차이를 보이기 때문일 것이다.

백그라운드의 차이는 무엇인가? 딥러닝의 근본 없음.... 아니 사실 딥러닝이 갖고 있는 특이적 문제들에 대한 질문으로부터 시작될 것이다. 딥러닝의 근본은 어디서 오는 것인가에 대한 질문이다. 일반적으로 (딥러닝 레볼루션에서 언급한대로) 1957년의 퍼셉트론부터 시작이 될 것이다. 이후 70년대에? 80년대에 무엇이 있는가? 90년대에 무엇이 있는가? 라고 하면 좀 문제인게 일반적으로 이 때는 뉴럴넷 관련 연구가 개차반이었던 시절이기도하고, 선형 분류기를 여러개를 묶어서 돌리는 형태로 돌렸을 떄 은닉층이라고 불리는 중간 계층에 대한 조정 혹은 보정을 하는게 불가능했었던 시절이기 때문이다. (발견은 70년대 후반, 논문은 80년대에 나왔다지만) 다행히도, 백프로파게이션이 90년대부터 널리 쓰이기 시작하면서 CNN이 뜨기 시작했다. 하지만 이 때에도 CNN은 문제가 많았었는데, GPU라는 개념도 희박하던 시절이고, 결국 대량의 CPU나 특수 목적으로 칩셋을 만들어서 썼던 (ASIC이라는 이름이 그 때도 있었는가는 모르겠다. 그 때 태어나서 (...)) 시절이었다. 컴퓨팅 파워가 낮아서 실제로 쓸만한 수준으로 시스템을 운영하지 못한 것이다. 영상처리 가르치던 교수님이 그 때를 회상하면서 8bit로 영상처리하는 건 기적이었다고 말 하면서 요즘 컴퓨터 좋아졌다는 이야기를 할 정도였었고, 386 CPU가 뭐 대단하다고 실시간으로 영상처리를 했곘는가를 생각해보면 쉽다.

여튼, 2000년대로 오면, 코호넨 네트워크 같은 녀석이나 RNN이 본격적으로 등장한다. 그 때까지만 해도, 사실 이 때부터 ML 관련판에서는 이야기가 나오기 시작하였고 2012~2014년도에 엄청 이거 관련된 이야기를 많이 접했던 기억이 있다. LSTM이 나오고, 뭐 그런 부분은 2015년도부터 유명해진 이야기고 (기억에 의존하는 거라 틀렸을 가능성이 크다. 위키에서는 90년대로 돌아가는데... 아마 2016년 이후일 가능성도 크다) 실제로 사실 그 당시에 DNN 관련된 부분만 해도 참 최신 트랜드였다는 것을 기억한다. 인공지능, 현대적 접근」 3판이 한국에 류광체... 아니 류광님의 번역으로 나왔을 때, 인공지능 수업을 학교에서 제대로 배웠었는데, DNN은 진짜 슬라이드 10장으로 약간 공부를 했었고, RNN 백 프로파게이션 증명이 시험 문제로 나왔을 정도로 NN 쪽은 대충 배웠었다. 오히려 디씨전 트리나, SVM, 퍼셉트론 등을 더 자세하게 배웠고, 그것의 도움을 일 할 때 많이 받았었다.

근데, 인공지능 이야기를 왜 주구장창 하느냐고? 사실 딥러닝 옹호론자, 혹은 딥러닝 이전의 세계에 대해서는 뭔 실패한 사람처럼 언급을 한다는 점이 언제나 거슬린다는 거고, 특히 딥러닝 이전에 수 많은 시도들이나 시행착오들에 대해서 그렇게 짧고 간단하게 넘어갈 이야기는 아니라는 점이다. AI가 대세라고, 딥러닝과 뉴럴넷이면 세상을 바꾼다고 하는 나팔수들의 이야기들을 볼 때마다 느끼는 건 도대체 니네는 이 필드에 기여를 한게 뭔데 그렇게 자신감에 차서 나팔수 노릇을 하고 있느냐의 질문일 것이다.

인공지능은 천대받는 학문이었다. 인기도 엄청 없었고, 논문도 잘 안 나왔었고, 사실 하는 사람만 하는 학문이었고 번역서도 그렇게 많지 않았었다. 오히려 영상처리나 NLP 같은 실용적인 부분들에 있어서 많이 쓰이긴 했지만 한계는 분명한 상황이었고, 취미로 하기에는 적당하지만 업으로 삼기에는 너무 힘든 학문이었다. 50년대나 8~90년대에 받던 냉대나, 철학계의 공격이나, 인공지능 무용론에 비할바는 있겠냐만은 2000년대 중후반의 인공지능은 사실 용도 제한적인 특정 분야에서만 쓸 수 있는 기술이었고 이에 따라서 관심 갖을 사람들만 관심을 갖는 학문이었던 것도 사실이다.

결과적으로 천대 받던 시절을 지나 뉴럴넷이 세상을 바꾼다는 이야기가 나올 때부터 인공지능 말고 딴 분야를 하게 되었다. (사실 이 때 되면 노이즈나 바이럴이 더 많아지는 시기이기도 하고, 사실 싹 다 영상처리에 몰려있는 상황에서 NLP 공부하던 학부생이 뭘 더 할 것도 없었다. 그리고 NLP는 취미 생활이지 돈 벌려고 한 것도 아니고) 그리고, 아직도 뉴럴넷, 특히 딥러닝 관련해서는 정말로 싫어하는 편이다. 요즘 논문 트랜드는 다시 통계학이나 수학 베이스로 돌아가니 볼만한 것들은 보고 있지만, 솔직히 지금의 열기는 너무 과열이 되었다고 생각을 하고, 장기적으로 다시 꺼질 버블이라고 생각하고 있다. 결과적으로 다시 주기적 순환 속에서 침체기에 들어갈 것이다.

개발자나 다양한 사람들이 피상적인 형태의 무언가를 보고 호오가 갈리는 걸 정말 많이 봤다. 딥러닝 옹호론자들이 생겨났을 때, 실제로 인공지능이나 관련 학문을 배웠던 사람보다는 일단 TF깔고 뭐 돌리고, SPSS에서 툴 돌리고 뭐 할 줄 안다고 하고, 뭐 일단 잘 되는 예제들 돌리고 나는 인공지능을 잘 해! 라고 하는 사람들이 태반이었다. 그리고 그 중 대부분이 "ML 그거 망한거 아니에요 ㅎㅎ?" 라고 했었던 인간들이었었다. 기존 베이스나 기존 학문에 대해서 한 치의 존경도 없이 하이프나 인기에 따라가는 사람들인데, 솔직히 진짜 힙스터라는 말 밖에 붙여줄 수 밖에 없다. 기술 이해도가 뛰어난 것도 아니고, 뭐 맨날 얕게 배워서 얕게 쓰고 넘어가는게 기본인데, 꼭 그럴 때마다 구 기술이나 이전 세대를 무시하는 행동을 꼭 했었었고, 사실 이런 무례함이야말로 그런 사람들을 멀리하게 하는 계기가 되었다. (그러고보니 펑셔널 랭귀지 했을 때도 비슷한 경험이 있다 ㅠㅠ)

전기차건, 드론이건, 인공지능이건, 4차 산업 혁명이라고 붙은 모든 이름의 것들은 대부분 암흑기나 겨울을 지나서 대세가 되고, 주류 시스템에 편입되는 과정을 거쳤다. 드론은 쿼드롭터 날리면서 놀던 사람들이 선구자가 되었고, 전기차는 초기 개척자인 테슬라, 인공지능은 관련 연구자들이나 취미 생활을 하던 사람들이 주도적으로 업계를 끌어왔었다. 그리고, 일단 업계가 성숙하거나 시장이 커지면, 기술적 부족함이나 부실함에 대해서 기성 업체들의 기술을 접목해서 확장하는 형태로 신기술이 성숙화된다. 자세제어 기술이나 관성 제어 같은 기술들이나 모터 관련된 노하우들은 기존의 항공 관련 기업이나 로보틱스 분야의 도움을 받고, 배터리 효율이나 대량 생산의 경우 라인을 갖고 있는 공장에서 도움을 받으며, 수학과 통계학을 기반으로 모델을 해석하는 등이 그 예일 것이다. 이 때에는 기존 시장에서 낮은 기술 집적도와 넓은 연계 연구들의 도움을 받아 움직이게 된다. 그 후 다시 성숙기로 가면 레드오션이 되고, 기술적 집적, n%p 단위의 공정 개선 경쟁, 전문가들의 등장 등으로 다시 시장 혹은 기술에 대한 고도화가 이루어진다.

이런면에서 블록체인도 비슷한 하이프를 겪고 있는데, 특히 요즘 SSI/DID가 대세가 되면서 아마도 블록체인에 기반한 투명한 데이터 공유나 GPG/PGP의 대안 형태의 메시징이나, ECDSA 관련된 기술적 진보, Shnorr 관련 멀티 시그 기술 등등 여러가지 기술들이 겹치면서 나오는 안정적인 데이터 공유 등이 대세가 되면, 대중화가 될 것이고, 기술 힙스터들이 몰려올 것이다. 뭔 김치국부터 마시는 이야기냐고 할 수는 있겠지만, 지금 이 타이밍에 블록체인 기술은 이미 성숙기로 들어간 상태이고, 기존 기업들은 기술력이 있느냐 없느냐로 이미 시험을 충분히 받은 상태라는 점, 그리고 이더리움 2.0 기준으로 샤딩이나 분산 데이터 저장 등이 대세가 되어 안정기로 넘어갈 타이밍이라는 것이다. 샤딩이 중요한 것인가? 라고 물어본다면, 이게 아마도 블록체인의 PoW가 갖고 있는 문제를 해결하리라 보기 때문이다.

블록체인 기술은 섹시하다. 아니 원자력 발전소 10 기의 발전량을 쳐 먹는 수준의 PoW 시스템이 섹시한가? 라고 물어본다면, 아마도 그것은 대안 기술들 (텐더민트, RAFT, DPoS, Sharding, L2 기술, 오프체인/사이드체인 기술...) 들에 의해서 개선이 될 것이기 때문이다. 그리고, 그 개선 과정에서 많은 사람들의 도움과 기성 시스템(분산처리, 게임이론, 금융공학, 네트워크 스택, 암호학, 라이브러리 등등)에 도움을 받아서 성장을 할 것이기도 하다.

이런면에서, 나는 사실 블록체인에 대한 대중 인식이나 개발자의 인식이 싫은 편이다. 뭔 말만하면 사기 기술이라느니 -이미 기술 기반은 다져져있다- 기술적 특이점이 없다느니 이런 말을 하지만, 실제로 알게 모르게 블록체인에 연계된 기술들의 혜택을 받고 있다는 것이다. 다들 해시 함수와 비대칭키 암호화의 노예이자 토렌트의 숙주들인데, 뭐 그러면서 블록체인 기술을 욕해?!

개발자들 중에서 블록체인 디스하는 사람들의 변절을 제일 경계하게 된다. 딥러닝 때도 그랬고, ML까던 사람이 뭔 신내림을 받은 듯이 딥러닝 찬양을 하고 있지를 않나, 갑자기 전도사가 되어서 너희는 인공지능을 모른다 이런 소리를 하지를 않나, 뭔 ML 기초도 모르면서 커널이 어떻다고 말을 하지를 않나 -.-; 이런 사람들이 양산될 것은 뻔하다. 이미 이 업계는 DeFi, 커스터디, ERC-1155, 탈중앙화, DID 이딴 요상한 말들로 진저리가 날 정도인데, 더 이상한 사람들을 보게 되는 건 정말 사절인데 말이다.

그래서, 그렇다면 신내림을 받은 사람들은 이제 무엇을 이야기할 것이냐? 이것도 제일 재미있는 질문일 것이다. 사실 예상하는 부분은 이더리움의 스마트컨트랙트 개발로 세상이 평등해진다는 평등주의자, keybase.io랑 DID가 다르지 않다는 걸 깨달은 개발자들의 대거 이주(도대체 왜?), UbiKey의 secp256k1 지원으로 암호화폐 거래를 본격적으로 하면서 이게 금융의 대안이라고 주장하는 금융의 ㄱ자도 모르는 사람들, 공인인증서의 대체재가 SSI라고 주장하는 사람들, 분산컴퓨팅의 끝이라고 특정 블록체인을 밀어주는 사람, 타원곡선암호의 매력에 빠져서 curve25519 전파하듯이 secp256k1 전파하는 사람 등등 별의별 인간 군상이 예상된다.

아 나도 개발자들 다 있는 Ubikey있고. Keybase도 초창기부터 가입했고, 뭐 별의별 힙스터 물건들은 다 쓰고 있긴하다. 근데, 까놓고 말하자 keybase로 나는 스텔라루멘 거래는 해봤지만 그걸로 채팅 제대로 해 본적은 없고, Ubikey로 2FA 열심히 한다지만 이걸로 GPG/PGP 서명 제대로 한 적은 손에 꼽는다. 사실 최애 서비스는 Authy와 1Password인데, 이건 너무 레거시해서 다들 싫어하지 않나?

이미 블록체인의 버블은 다시 시작되었다. IITP도 그렇고, KISA도 그렇고, 뭐 다들 DID에 미쳐있다. 그리고 곧 DID로 여권과 주민등록증과 각종 공무원 서류들을 대체할 수 있다는 강한 믿음을 갖고 있는 사람들이 한 무더기가 되었다. 뭐 SSI Meetup 등 제대로 굴러가는데도 많지만, 사실 발로 만든 DID 서비스들이 우후죽순 생겨나고 퍼블릭 네트워크를 쓰지도 않으면서, 탈중앙화 된 신원인증이라고 설치고 있다. DID는 블록체인의 쓸모를 증명하는 서비스이자, 탈중앙화된 탈중앙집권적인 시스템이 될 것이다. 이를 기대하면서 미래의 벽돌을 쌓고는 있지만, 사실 걱정되는 건 매한가지다. 결국 이 업계도 인공지능이 겪었던 것처럼 핫한 시점이 다시 올 것이고, 기존 ML이 겪었던 고충들을 또 다시 겪을 것이다. 그리고, 난 그 때에 또 짐을 싸고 딴 곳으로 가면 갔었지, 계속 남아서 뭘 하진 않을 것 같다. :P