모든 AI가 오픈소스화 되기를 간절히 원하는 똑똑하면서도 선의에 찬 이들이 있다. 그러나 AI라고 해서 별다를 건 없다.
이번만큼은 다를 것이라고 기대하곤 한다. 역사가 반복되지 않을 수 있다는 기대를 품는다. 완벽한 오픈소스 라이선스를 통해 모두가 평화와 사랑, 그리고 자유롭게 공유되는 코드에 열광할 수 있기를 기대하는 것이다. 하지만 ‘오픈소스’라는 용어가 등장한 지 26년이 지났다. 오픈소스 소프트웨어는 분명 인기가 있지만, 또 전 세계 소프트웨어의 대다수는 오픈소스를 포함하고 있지만, 오픈소스 라이선스가 적용되는 소프트웨어는 일부에 불과하다.
오픈소스 이니셔티브 (OSI) 메일링 리스트에서 활동하는 개발자를 포함하여 대부분의 개발자는 이러한 현실을 잘 알고 있는 듯하다. 이들 대부분은 수많은 폐쇄형 하드웨어와 소프트웨어를 사용하고 있다. 이러한 현실은, ‘오픈소스 AI’(그것이 무엇을 의미하든)에 대한 지지가 급증하고 있음에도 불구하고, 독점 모델이 소프트웨어를 지배해 온 것처럼 대부분의 독점 라이선스가 AI를 지배할 가능성이 매우 높다는 의미다.
그렇다면 이를 개탄해야 할까?
이번만큼은 다르다면 좋겠지만 소프트웨어의 역사는 독점 라이선스와 오픈소스의 지속적인 혼합이었다. AI라고 해서 다를 것이라고 생각할 이유도, 또 달라야 한다고 생각할 이유도 거의 없다.
쳇바퀴
스티븐 본-니콜스는 “오픈소스 AI를 정의하는 것은 아직 해결되지 않은 복잡한 문제다”라고 진단했다. 필자는 한 가지 더 말하고자 한다. “해결되지 않을 것이다. 당분간은, 어쩌면 절대로.”
필자는 몇 주 전 이 아이디어를 살펴보고 다음과 같이 서술한 바 있다. “OSI와 다른 사람들이 업데이트된 오픈소스 정의(OSD)로 나아가기 위해 위원회를 구성하려고 하는 동안, 메타 같은 강력한 참여자들이 업계를 정의하는 수준의 모델을 출시하면서 ’오픈소스’라고 표현했다. 그리고 일부는 이에 대해 오픈소스 정의에 맞지 않는 표현이라고 질책했다. 그러나 그들은 전혀 신경 쓰지 않고 있다. 기본적으로 오늘날의 모델 중 우리가 전통적으로 생각해 온 방식으로 ‘오픈소스’라고 할 수 있는 것은 없다.”
기뻐할 일까지는 아니겠지만 익숙해져야 한다. 오픈소스의 규모가 그 어느 때보다 커진 것은 사실이지만, 우리는 여전히 상대적인 반올림 오류를 범하고 있다. 우리가 사용하는 대부분의 소프트웨어는 내부에 오픈소스가 포함되어 있더라도 오픈소스로 라이선스가 부여되지 않았다. 오픈소스가 필수적인 요소이지만, 오픈소스만으로 완성된 제품은 거의 없다.
AI가 우리가 의존하는 소프트웨어와 시스템에 점점 더 많이 침투할 가능성을 고려할 때, 이러한 AI 모델이 오픈소스화되기를 기대할 수야 있겠지만 그 기대는 비현실적이다. 본-니콜스는 “최고의 AI 공급업체들이 프로그램과 데이터 세트를 오픈소스화하지 않으려 한다”고 비난하며 “기업들은 투명성, 협업, 혁신이라는 오픈소스의 긍정적인 의미로 자신들의 프로그램을 포장하고자 시도한다”라고 말했다.
그럴 수 있다. 하지만 어쩌면 모든 코드를 공개하는 것이 비즈니스에 좋지 않다고 판단해 공개하지 않는 것일 수도 있다. 일부 사람들은 레드햇을 비즈니스 성공의 전형적인 예로 거들먹거리지만, 사실 메타, AWS 등과 비교하면 초라한 사례에 불과하다. 허깅페이스의 사샤 루치오니는 유엔 OSPO 포 굿 컨퍼런스에서 “오픈소스 라이선스가 정의하는 대로 모든 기업이 100% 오픈소스를 사용하길 기대할 수는 없다. 기업이 수익을 창출하는 모든 것을 포기하고 자신들이 편한 방식으로 오픈소스를 사용하길 기대할 수는 없다”라고 말했다.
그저 할 일을 하자
현실이 달라지기를 바랄 수야 있겠지만, 수십 년 동안 오픈소스와 독점 소프트웨어가 함께 편안하게 공존해왔는데 AI라고 달라질 것이라고 기대할 이유가 있을까?
클라우드와 그 이전의 온프레미스 소프트웨어와 마찬가지로 대부분의 AI 소프트웨어는 오픈소스가 아닐 것이다. 대부분의 개발자는 오픈소스 문제보다 퇴근 후 자녀의 축구 경기에 가는 것에 더 신경을 쓸 것이다. 지난 몇 년 동안 우리는 오픈소스에 대한 잘못된 대화에 집착해 왔고, 젊은 개발자 상당수는 오픈소스를 외면해 왔다.
하지만 젊은 개발자든 나이든 개발자든 모두 일을 완수하는 데 관심이 있다. 개발자들은 미스트랄의 최신 모델의 비용, 속도, 성능 향상에 관심을 가질 뿐 오픈소스가 아닌 라이선스에 대해서는 크게 신경 쓰지 않는다. 오픈AI, 메타에 대해서도 마찬가지다.
그렇다고 오픈소스가 AI에 중요하지 않다는 말은 아니다. 오픈소스는 그저 중요한 요소 중 하나이지 유일한 요소는 아니라는 말이다. 오픈소스 라이선스에 집착하다 보면 최소한의 번거로움으로 업무를 처리하는 데 도움이 되는 소프트웨어가 필요한 수천만 명의 개발자를 놓치게 된다.
* Matt Asay는 몽고DB의 개발자 관계 업무를 담당하고 있다. 그러나 본 글은 몽고DB의 입장이 아니다.
dl-ciokorea@foundryco.com