Chinese (Simplified) English Italian Japanese Korean Portuguese Spanish

GPU 1개로 충분한 멀티모달 AI 구글 젬마3

반응형

2025년 3월 12일 구글이 GPU 1개로 충분한 멀티모달 AI 젬마 3을 공개하며 도약을 시도하고 있다. 젬마 3은 중국 딥시크가 나온 이후 성능뿐 아니라 경제성과 연산효율 면에서 경쟁력을 갖춘 오픈소스 거대언어모델이다. 

 

딥시크보다 효율성 높은 구글 젬마 3 , GPU 1개로 충분

2025년 연초에 중국 딥시크가 나온 이후 AI 업계는 성능뿐 아니라 경제성과 연산효율까지 중요한 이슈로 떠오르고 있다. 이에 구글은 2025년 3월 여러 면에서 경쟁력을 갖춘 오픈소스 거대언어모델 젬마 3을 출시했다.

 

구글 AI 젬마3. 파이토치 한국 사용자 모임

 

 딥시크만 해도 오픈 AI 보다 훨씬 높은 효율성을 자랑한다. 이에 맞서 구글이 내세운 젬마 3은 단일 그래픽처리장치(GPU) 환경에서도 높은 성능을 발휘해 딥시크의 효율성을 능가한다.

 

https://weekly.donga.com/science/article/all/11/5514055/1

 

 젬마3의 연산 최적화를 강화했기 때문이다. 구글이 공개한 젬마 3은 10억 ~270억 개의 AI 학습파라미터(매개변수)를 갖춘 다양한 버전이 있어서 사용자는 필요에 따라 적절한 모델을 선택할 수 있다. 

 

 젬마3의 특징은 최대 12만 8천 개 토큰(정보단위)을 한 번에 처리할 수 있어서 긴 문서나 방대한 데이터를 빠르고 정밀하게 분석할 수 있다는 점이다. 

 

GPU 1개로 충분한 멀티모달 AI 젬마 3

젬마 3의 구체적인 성능은 AI 모델의 연산 효율을 평가하는 엘로 Elo 점수로 알 수 있다. 엘로 점수는 체스 게임에서 선수들 실력을 평가하는 데 쓰이며 최근에는 AI모델의 성능을 보여주는 지표로도 쓰인다. 

 

 구글 딥마인드가 공개한 젬마 3 기술보고서에 의하면 딥시크의 R1 모델의 엘로 점수는 1338~1363점을 기록했고 젬마 3은 엘로 점수의 93% 수준에 도달해 R1이 다소 앞선다. 그러나 연산 자원의 효율성 측면에서 젬마 3가 R1을 앞선다. 

 

 R1은 엔비디아 GPU H100을 32개 사용하는 반면 젬마 3은 단 한 개의 GPU만으로 동일한 성능을 구현할 수 있다고 구글은 말한다. 높은 연산 효율 덕분에 젬마 3은 메타의 라마 LLaMA3와 비교해도 더 적은 GPU 자원으로 더 높은 엘로 점수를 기록했다. 

 

 AI 모델은 파라미터 수가 많을수록 속도가 느려진다. 젬마 3가 이러한 연산 부담을 줄인 방법은 대형모델에서 학습된 정보를 압축해 작은 모델로 전이하는 방식이다.

 

 그 결과 딥시크 R1은 6710개 매개변수를 사용하고 필요한 경우 370억 개 매개변수를 선택적으로 활성화할 수 있는데 비해 젬마 3은 10억~270억 개 매개변수만으로도 뛰어난 성능을 발휘한다. 

 

멀티모달 AI 시대 오픈소스로 승부하는 구글

구글은 젬마 3 출시를 하면서 메타, 오픈 AI외 딥시크 등 주요 AI기업과 경쟁하며 더욱 개방적이고 확장성 높은 AI 생태계를 구축하고 있다. 단순히 성능만 뛰어난 AI 모델을 만들어내는 것에 그치지 않고 개발 및 활용의 진입 장벽을 낮춘다는 게 구글의 전략이다. 

 

 특히 젬마 3에서 주목할 점은 멀티모달 AI로 설계됐다는 점이다. 멀티모달 AI(Multi Modal AI)는 자연어 처리(NLP) 한계를 넘어 텍스트., 이미지, 영상과 음성 등 다양한 데이터를 동시에 이해하고 분석할 수 있는 기술이다.

 

 시그립(SigLIP) 비전 인코더'는 최대 896 X 896 해상도가 이미지를 처리할 수 있게 설계됐다. 현재 오픈 AI의 GPT-4 터보, 메타의 라마 3 등도 멀티모달 기능을 지원하지만, 대부분 폐쇄형 모델이라 접근이 제한적이다. 폐쇄형 모델은 돈을 내야 사용할 수 있다. 

 

 반면에 젬마 3는 오픈소스 기반으로 연구자와 개발자들이 무료로 자유롭게 활용하고 최적화할 수 있다. 멀티모달 AI는 아직 초기 단계이나 AI와 인간의 상호작용 방식을 근본적으로 변화시킬 혁신적인 기술 중 하나다.

 

 멀티모달 AI는 인간의 감각 처리 방식을 모방해 더욱 직관적인 방식으로 정보를 처리할 수 있어 의료 진단, 자율주행, 감정 분석, 산업용 로봇 등 다양한 분야에서 응용이 가능하다.

 

 마이크로스프트의 MVP를 22회 수상한 기술 전문가 브라이언 포지는 기술 간담회에서 멀티모달 AI는 앞으로 가장 주목해야 할 핵심 트렌드라며 향후 10년 동안 AI가 이룰 발전의 기반이 될 것이라고 강조했다. 

 

함께 읽으면 좋은 글

https://togethergoodeffect.tistory.com/entry/검색-시장-반독점-소송-패소로-구글-분할-위기와-AI-사업

맺음말

2025년 3월 12일 구글이 GPU 1개로 충분한 멀티모달 AI 젬마 3을 공개하며 도약을 시도하고 있다. 젬마 3은 중국 딥시크가 나온 이후 성능, 경제성과 연산효율 면에서 경쟁력을 갖춘 오픈소스 거대언어모델이다. 

반응형

댓글

Designed by JB FACTORY