티스토리 뷰
Google 팀이 공동으로 개발한 Gemini는 텍스트, 코드, 오디오, 이미지 및 비디오를 처리하고 결합할 수 있는 다중 모드 모델입니다. 데이터 센터에서 모바일 장치에 이르기까지 다양한 플랫폼에서 실행될 수 있도록 유연하고 효율적으로 설계되었습니다.
Gemini는 Ultra, Pro, Nano 의 세 가지 버전으로 제공되며 각각은 다양한 규모와 작업 복잡성에 최적화되어 있습니다.
Gemini Ultra는 MMLU(대규모 멀티태스킹 언어 이해 ) 분야에서 인간 전문가를 능가했으며 , 이미지 이해 및 복잡한 추론을 포함한 다양한 벤치마크에서 이전 모델을 능가했습니다. 또한 고급 버전인 AlphaCode 2를 사용하여 프로그래밍 경쟁에서 뛰어난 성능을 발휘하는 등 코딩 능력도 뛰어납니다.
Gemini의 개발에는 Google의 TPU(텐서 처리 장치)가 활용되어 효율성과 확장성이 보장되었습니다.
다중 모드 기능을 통해 Gemini는 다양한 형식의 복잡한 정보를 분석하여 과학 및 금융과 같은 분야에 도움을 줄 수 있습니다.
Gemini는 Bard, Pixel, Search 등과 같은 다양한 Google 제품에 통합되고 있습니다.
Gemini API를 통해 개발자와 기업 고객이 사용할 수 있으며 Gemini Ultra는 광범위한 안전 확인 및 개선을 거쳐 출시될 예정입니다.
구글의 '제미니(Gemini)'는 생성 AI를 위한 모바일 혁신을 이룬다.
기술 회사는 휴대폰을 통해 실행할 수 있고 컴퓨팅 비용을 대폭 절감할 수 있는 새로운 고급 모델을 출시합니다.
Google은 처음으로 휴대폰에서 직접 실행될 새로운 생성 인공 지능 모델 세트를 출시했습니다.
이는 ChatGPT 제조사인 OpenAI와 같은 경쟁 업체를 상대하려는 기술 회사의 노력에 획기적인 진전입니다.
회사는 'Gemini'를 이미지와 오디오의 정보를 분석할 수 있고 정교한 추론과 '계획' 능력을 갖춘 '가장 크고, 가장 유능하며, 가장 일반적인' AI 시스템이라고 설명했습니다. 이는 수요일부터 Google의 Bard 챗봇을 지원하고 내년부터 검색 엔진에 더욱 광범위하게 출시될 예정입니다.
'나노'로 알려진 Gemini 버전은 모바일 장치에서 실행되도록 특별히 설계되었으며 Google의 최신 Pixel 휴대폰에 통합됩니다.
구글은 파이낸셜타임스에 이것이 기기에서 "기본적으로 실행"될 것이며 "나노" 모델은 "모바일에 최적화되어 있다"고 말했다. 따라서 안드로이드 개발자는 오프라인에서 작동하는 AI 앱과 기능을 쉽게 구축하거나 개인정보를 더 잘 보관할 수 있다.
이러한 발전은 기술의 경제적 문제를 해결하는 데 도움이 될 수 있습니다. 거대 기술 그룹이 운영하는 서버의 클라우드를 통하지 않고 모바일 단말기에서 사용할 수 있는 컴퓨팅 성능으로 생성 AI를 실행하면 이러한 시스템 운영 비용이 크게 절감됩니다. 이는 또한 개인 데이터를 장치로 제한하여 유지하려는 사람들에게 보증 계층을 제공합니다.
구글과 알파벳의 순다르 피차이 최고경영자(CEO)는 블로그 게시물에서 "지금 우리가 보고 있는 AI의 전환은 모바일이나 웹으로의 전환보다 훨씬 더 큰, 우리 생애에서 가장 심오한 전환이 될 것이라고 믿는다"고 말했다. "모델의 새로운 시대는 우리가 회사로서 수행한 가장 큰 과학 및 엔지니어링 노력 중 하나를 나타냅니다."
제너레이티브 AI(Generative AI)는 실리콘밸리 전역의 거대 기술 지배력을 위한 전쟁에서 새로운 전선을 열었습니다. Google의 최신 생성 AI 시스템은 Microsoft가 지원하는 OpenAI, Meta, Anthropic 및 Mistral과 같은 스타트업을 비롯한 여러 회사에서 출시한 여러 모델을 따릅니다. 이 모델은 모두 텍스트, 코드, 텍스트 등 자연어로 질문에 대한 그럴듯한 답변을 생성할 수 있습니다. 이미지와 오디오.
지난 달 거대 기업인 Microsoft 는 Word, PowerPoint 및 Excel을 포함하여 널리 사용되는 Microsoft 365 생산성 앱 제품군에 Copilot이라는 생성 AI 도우미를 출시했습니다 .
구글은 제미니가 생성 AI 제품의 기반이 되는 기술인 소위 대규모 언어 모델을 평가하는 '업계 표준' 벤치마크에서 90% 이상의 점수를 얻었다고 밝혔습니다.
회사는 Gemini가 여러 테스트에서 OpenAI의 GPT4 모델을 능가하여 특정 작업에서 인간 전문가를 능가하는 최초의 AI 모델이라고 덧붙였습니다. 특히 수학적 추론 문제를 해결하고 과학적인 데이터를 분석하며 고급 코딩을 할 수 있습니다. Google은 언론인에게 브리핑할 때 OpenAI의 GPT4 모델과의 비교를 제공하지 않았지만 나중에 블로그 에서 이를 명확히 했습니다.
Gemini는 또한 수요일부터 미국, 아시아, 아프리카를 포함한 170개 이상의 지역에서 영어로 제공되는 Google의 AI 기반 챗봇인 Bard에 통합될 예정이며, 내년에는 더욱 강력한 소프트웨어로 업데이트할 계획입니다.
그러나 Google이 규제 장애물로 인해 제안한 유럽이나 영국에서는 아직 사용할 수 없습니다.
“우리는 확실히 그 문제를 해결하기 위해 노력하고 있으며 현지 규제 기관과도 분명히 협력하고 있습니다. . . Google의 부사장이자 Bard의 총괄 관리자인 Sissie Hsiao는 “특정 영역에 진출하기 전에 이들과 협력하고 있는지 확인하는 것입니다.”라고 말했습니다.
Hsiao는 통합을 통해 Bard의 "콘텐츠 이해 및 요약, 추론, 브레인스토밍, 글쓰기, 계획" 능력이 향상될 것이라고 말했습니다.
Google이 시연한 Gemini 사용 사례에는 손으로 쓴 수학 공식 워크시트 스캔, 오류 표시 및 설명이 포함됩니다.
YouTube 사용자 Mark Rober의 또 다른 시연에서는 Gemini와 통합된 Bard를 사용하여 가장 공기 역학적인 종이 비행기를 만드는 방법을 테스트하는 비디오를 감독했습니다. AI는 불의 고리를 통해 발사하는 것을 포함하여 정확성을 테스트하는 방법과 디자인에 대한 실험과 개선을 제안했습니다.
Gemini 버전은 12월 내내 일부 개발자와 기업 고객에게 제공될 예정이며, 내년에는 더욱 광범위하게 액세스할 수 있게 될 것입니다.
구글은 어려운 질문에 답할 때 "더 신중하게 생각"할 수 있는 고급 "추론 기능"을 갖춘 인공 지능(AI) 모델을 출시했습니다.
AI 콘텐츠 생성기는 때때로 개발자가 환각이라고 부르는 것을 발명하는 것으로 알려져 있습니다.
Gemini는 수학 및 인문학을 포함한 57개 과목의 문제 해결 및 지식을 테스트했습니다.
순다르 피차이(Sundar Pichai) 사장은 이것이 AI의 "새로운 시대"를 상징한다고 말했습니다.
구글은 올해 초 자사의 AI 챗봇인 바드(Bard) 출시에 대해 신중한 접근 방식을 채택했으며 이를 "실험"이라고 설명했습니다.
Bard는 자체 홍보 데모에서 우주에 관한 질문에 잘못된 답변을 제공하는 실수를 저질렀습니다.
그러나 구글은 새로운 모델이 아직까지 "가장 유능하다"고 설명하면서 다양한 지능 테스트에서 인간 전문가를 능가할 수 있다고 주장했습니다.
Gemini는 텍스트, 이미지, 오디오를 인식하고 생성할 수 있지만 그 자체로는 제품이 아닙니다.
대신 이는 기본 모델로 알려져 있으며, 이는 검색 및 Bard를 포함한 Google의 기존 도구에 통합된다는 의미입니다.
Gartner 분석가의 Chirag Dekate에 따르면 Gemini는 그림과 같은 텍스트 이외의 소스로부터 학습하는 능력을 강조하는 "새로운 표준"을 세운 것으로 보입니다.
그는 이것이 "생성 AI를 변화시킬 가능성이 있는 혁신을 가능하게 할 수 있다"고 말했습니다.
Google은 지금까지 OpenAI의 바이러스성 챗봇 ChatGPT만큼 많은 관심과 사용자를 유치하기 위해 노력해 왔습니다.
그러나 Gemini의 가장 강력한 버전은 널리 사용되는 학술 벤치마크 32개 중 30개에서 ChatGPT를 구동하는 OpenAI 플랫폼 GPT-4보다 성능이 뛰어나다고 주장합니다.
그러나 OpenAI 소프트웨어의 새롭고 더욱 강력한 버전은 내년에 출시될 예정이며 CEO인 Sam Altman은 이 회사의 새로운 제품이 현재 제품을 "기묘한 친척"처럼 보이게 만들 것이라고 말했습니다.
Altman이 며칠 만에 해고되고 재고용되는 것을 본 OpenAI의 최근 혼란이 해당 출시에 어떤 영향을 미칠지 는 아직 알 수 없습니다 .
또한 이 회사는 연구 개발에 투자하기 위해 최대 10억 달러를 모금하려는 Elon Musk의 xAI와의 새로운 경쟁에 직면해 있습니다. 중국 기업 바이두(Baidu)도 자체 AI 제품으로 앞서가고 있다.
그러나 기술이 빠르게 발전함에 따라 해를 끼칠 가능성에 대한 두려움도 커졌습니다.
전 세계 정부는 AI로 인해 발생할 수 있는 미래 위험을 억제하기 위한 규칙이나 법안을 개발하려고 노력하고 있습니다.
11월 영국에서 열린 정상회담 에서 이 주제가 논의되었으며 , 서명국들은 안전한 개발을 촉구하는 선언에 동의했습니다. 국왕은 또한 "긴박감, 단결, 집단적 힘"을 가지고 위험 가능성을 해결해야 한다고 말했습니다.
Google과 Alphabet CEO Sundar Pichai의 메모:
모든 기술 변화는 과학적 발견을 발전시키고 인류의 발전을 가속화하며 삶을 개선할 수 있는 기회입니다.
나는 지금 우리가 보고 있는 AI의 전환이 이전의 모바일이나 웹으로의 전환보다 훨씬 더 큰, 우리 생애에서 가장 심오한 전환이 될 것이라고 믿습니다. AI는 일상적인 것부터 특별한 것까지 모든 사람들을 위해 기회를 창출할 수 있는 잠재력을 가지고 있습니다.
이는 혁신과 경제 발전의 새로운 물결을 가져올 것이며 이전에 볼 수 없었던 규모로 지식, 학습, 창의성 및 생산성을 촉진할 것입니다.
AI를 전 세계 모든 사람에게 도움이 되도록 만들 수 있는 기회가 저를 흥분시킵니다.
AI 우선 기업으로의 여정이 시작된 지 약 8년이 지났지만 발전 속도는 점점 더 빨라지고 있습니다.
이제 수백만 명의 사람들이 우리 제품 전반에 걸쳐 생성 AI를 사용하여 1년 전에도 할 수 없었던 일, 즉 답을 찾는 것부터 더 복잡한 작업까지 수행하고 있습니다. 새로운 도구를 사용하여 공동작업하고 창작하는 방법에 대한 질문입니다. 동시에 개발자들은 우리의 모델과 인프라를 사용하여 새로운 생성 AI 애플리케이션을 구축하고 있으며 전 세계의 스타트업과 기업은 AI 도구를 통해 성장하고 있습니다.
이는 놀라운 추진력이지만, 우리는 가능한 것의 표면을 긁기 시작했을 뿐입니다.
우리는 이 작업에 대담하고 책임감 있게 접근하고 있습니다. 이는 우리가 연구에 야심차게 노력하고 사람과 사회에 막대한 이익을 가져올 수 있는 역량을 추구하는 동시에 AI의 역량이 더욱 강화됨에 따라 안전 장치를 구축하고 정부 및 전문가와 협력하여 위험을 해결하는 것을 의미합니다. 그리고 우리는 AI 원칙 에 따라 최고의 도구, 기반 모델 및 인프라에 지속적으로 투자하고 이를 우리 제품과 다른 제품에 제공합니다 .
이제 우리는 수많은 주요 벤치마크에서 최고의 성능을 발휘하며 가장 유능하고 일반적인 모델인 Gemini를 통해 여정의 다음 단계를 밟고 있습니다. 첫 번째 버전인 Gemini 1.0은 Ultra, Pro, Nano 등 다양한 크기에 최적화되어 있습니다. 이는 Gemini 시대의 첫 번째 모델이자 올해 초 Google DeepMind를 설립했을 때 가졌던 비전의 첫 실현입니다. 이 새로운 모델 시대는 우리가 회사로서 수행해 온 가장 큰 과학 및 엔지니어링 노력 중 하나를 나타냅니다. 저는 앞으로의 일과 Gemini가 모든 사람들에게 열어줄 기회에 대해 진심으로 기대하고 있습니다.
– 순다르
'AI 생태계' 카테고리의 다른 글
Relightable 가우스 코덱 아바타 (0) | 2023.12.09 |
---|---|
차세대 AI 워크로드 지원: TPU v5p 및 AI 하이퍼컴퓨터 발표 (0) | 2023.12.07 |
Microsoft의 Copilot은 OpenAI의 최신 모델과 새로운 코드 해석기를 제공합니다. (0) | 2023.12.06 |
Amazon, 텍스트를 이미지로 변환하는 모델인 Titan Image Generator 출시 (0) | 2023.12.05 |
새로운 생성 AI 슈퍼컴퓨팅 인프라, 소프트웨어 및 서비스를 위한 AWS와 NVIDIA의 파트너십 (0) | 2023.12.03 |