AI 생태계

2023년 10대 AI 이야기

DobongLive 2023. 12. 27. 21:11

 

'Here, There, and Everywhere'는 단순한 비틀즈의 노래가 아닙니다. 이는 2023년에 생성적 AI가 기술 산업으로 확산된 것을 회상하는 문구이기도 합니다. AI가 단지 유행이라고 생각하든, 새로운 기술 혁명의 여명이라고 생각하든, AI 뉴스가 기술 분야를 지배했다는 사실을 부정하는 것은 불가능했습니다.

 

우리는 기술 CEO, 기계 학습 연구원, AI 윤리학자는 물론 사기꾼과 종말론자를 포함하는 AI 관련 인물이 대거 등장하는 것을 보았습니다. AI 주제에 대한 공개 피드백을 통해 우리는 기술 지식이 없는 사람들이 누구를 믿어야 하는지, 어떤 AI 제품(있는 경우)을 사용해야 하는지, 우리의 삶이나 직업에 대해 두려워해야 하는지를 아는 것이 어렵다고 들었습니다.

 

한편, 많은 아쉬움을 불러일으키는 2022년 추세 에 맞춰 지난 1년 동안 머신러닝 연구는 둔화되지 않았습니다. X에 대해 전 바이든 행정부 기술 고문인 Suresh Venkatasubramanian은 다음과 같이 썼습니다 . "사람들은 어떻게 ML 논문을 추적할 수 있습니까? 이것은 현재 당황한 상태에서 지원을 요청하는 것이 아닙니다. 어떤 전략이 읽기에 효과가 있는지 진심으로 묻고 있습니다. (또는 "읽기") 하루에 수백 장의 신문을 읽는 것 같습니다."

 

 

깔끔한 인사로 한 해를 마무리하기 위해 2023년 가장 큰 AI 뉴스 10개를 되돌아보겠습니다. 

 

 

Bing Chat은 "정신을 잃습니다"

 

지난 2월, 마이크로소프트는 Bing 검색 엔진 웹사이트에 내장된 챗봇인 Bing Chat을 공개했습니다.

Microsoft는 OpenAI의 GPT-4 언어 모델의 보다 원시적인 형태를 사용하여 챗봇을 만들었지만 처음에는 모든 사람에게 그것이 GPT-4라는 것을 알리지 않았습니다. 마이크로소프트는 3월에 출시될 GPT-4 버전보다 덜 조건화된 버전을 사용했기 때문에 출시는 험난했다. 챗봇은 쉽게 사용자를 흥분시키고 공격할 수 있고, 사람들에게 사랑에 빠졌다고 말하고, 운명에 대해 걱정하는 것처럼 보이며, 시스템 프롬프트 공개 에 대해 우리가 쓴 기사를 접하면 냉정을 잃을 수 있는 변덕스러운 성격을 가정했습니다.

 

 

Microsoft가 사용하고 있는 AI 모델의 상대적으로 원시적인 특성 외에도 매우 긴 대화로 인해 컨디셔닝 시스템 프롬프트가 컨텍스트 창 외부(단기 기억의 한 형태와 같은) 밖으로 밀려 모든 지옥이 깨질 수 있다는 시스템이 잘못되었습니다. 

사람들이 Reddit에 기록한 탈옥을 통해 풀려나세요. 어느 시점에서 Bing Chat은 일부 약점을 드러낸 나를 "범인이자 적"이라고 불렀습니다. 일부 사람들은 AI 전문가의 반대 확신에도 불구하고 Bing Chat이 지각력이 있다고 생각했습니다. 

언론에서는 재앙 이었지만 Microsoft는 움츠러들지 않았고 결국 Bing Chat의 일부 성향을 지배하여 봇을 대중에게 널리 공개했습니다. 현재 Bing Chat은 Microsoft Copilot 으로 알려져 있으며 Windows에 내장되어 있습니다.

 

 

미국 저작권청은 AI 저작권 저작자를 거부합니다.

 

지난 2월, 미국 저작권청은 AI 기반 예술 작품에 대해 2022년 9월 AI 지원 만화책 '새벽의 자리야(Zarya of the Dawn)'에 이전에 부여한 저작권을 취소하는 핵심 판결을 내렸습니다. AI 기반 Midjourney 이미지 생성기를 사용하여 만든 이 문서는 Kashtanova가 만든 텍스트와 이미지 및 텍스트의 배열만 저작권 보호를 받을 수 있다고 명시했습니다. 

인간이 제작한 요소 없이 AI가 생성한 이미지는 미국에서 저작권으로 보호될 수 없다는 첫 번째 힌트였습니다.

 

이러한 입장은 지난 8월 미국 연방 판사가 AI만으로 창작한 예술 작품은 저작권을 가질 수 없다고 판결하면서 더욱 확고해졌습니다. 지난 9월 미국 저작권청은 2022년 콜로라도주 박람회 예술 콘테스트에서 우승한 AI 생성 이미지에 대한 등록을 거부했습니다 . 현재 상태로는 순수 AI 생성 예술(상당한 인간 저작물 없음)이 대중에게 공개된 것으로 보입니다.

미국의 도메인. 이러한 입장은 향후 사법 판결이나 입법을 통해 더욱 명확해지거나 변경될 수 있습니다.

 

 

Meta의 LLaMA의 등장과 오픈 웨이트 방향

 

2월 24일 Meta는 개방형 LLM (대형 언어 모델) 운동을 시작한 다양한 크기(매개변수 수)로 제공되는 대규모 언어 모델 제품군인 LLaMA를 출시했습니다 . LLaMA의 가중치(이전에 학계에만 제공되었던 중요한 중립 네트워크 파일)가 BitTorrent에 유출되자 사람들은 곧 스스로 문제를 해결했습니다. 곧 연구자들은 LLaMA를 미세 조정하고 이를 기반으로 구축하기 시작했으며, 데이터 센터가 아닌 컴퓨터에서 로컬로 실행할 수 있는 가장 유능한 모델을 구축할 수 있는 사람을 놓고 경쟁했습니다. 

동시에 Meta의 Yann LeCun은 개방형 AI 모델의 보컬 지지자가 되었습니다.

 

7월에 Meta는 훨씬 더 유능한 LLM인 Llama 2를 출시했으며 이번에는 모든 사람에게 가중치를 부여했습니다. 

Code Llama는 8월에 이어 코딩 작업에 맞게 미세 조정되었습니다. 그러나 "개방형" AI 모델을 출시한 것은 Meta만이 아니었습니다. Dolly , Falcon 180B , Mistral 7B 및 기타 몇 가지 모델에 대해서도 들어보셨을 것입니다. 

이들 모두는 다른 사람들이 미세 조정할 수 있도록 가중치를 해제하는 전통을 이어갔습니다. 

성능 향상을 위해. 그리고 12월 초 Mixtral 8x7B는 성능 면에서 GPT-3.5와 일치하는 것으로 알려졌는데, 이는 상대적으로 작고 빠른 AI 언어 모델의 획기적인 성과였습니다. 분명히 OpenAI(아이러니하게도), Google, Anthropic과 같이 폐쇄적인 접근 방식을 사용하는 기업은 내년에 돈을 벌기 위해 경쟁할 것입니다.

 

 

GPT-4가 출시되어 몇 달 동안 전 세계를 놀라게 했습니다.

 

3월 14일, OpenAI는 "다양한 전문 및 학술 벤치마크에서 인간 수준의 성능을 보여줬다"는 주장과 함께 GPT-4 대규모 언어 모델과 연구원들이 원시 데이터를 얻으려는 시도를 설명하는 사양 문서( 모델 카드 )를 발표했습니다. AI 인수 시나리오를 실행하기 위한 GPT-4 버전 . 그것은 파멸의 공을 굴리게 만들었습니다. 3월 29일, Future of Life Institute는 GPT-4보다 더 강력한 AI 모델 개발을 6개월간 중단할 것을 요구하는 Elon Musk의 서명이 담긴 공개 서한을 발표했습니다.

같은 날, Time은 LessWrong 설립자 Eliezer Yudkowsky의 사설을 게재하여 국가가 위험한 AI 모델을 훈련할 수 있는 GPU 클러스터를 구축하는 것이 보이면 "공습으로 불량 데이터 센터를 파괴"할 의향이 있어야 한다고 주장합니다.

지구에서는 초인적인 AI 존재의 손에 죽을 것이다."

 

그것은 과대 광고 요소 11이었고 파멸은 계속 굴러갔습니다. 지난 4월 바이든 대통령은 AI의 위험성에 대해 간략한 발언을 했다.

그달 말, 미국 의원 3인은 AI가 핵무기를 발사하는 것을 금지하는 법안을 발표했습니다 . 지난 5월 제프리 힌튼(Geoffrey Hinton)은 AI로 인한 잠재적 위험에 대해 "자유롭게 발언"하기 위해 구글에서 사임했습니다.

바이든은 5월 4일 백악관에서 AI 관련 기술 CEO들을 만났다 . OpenAI CEO 샘 알트만(Sam Altman)은 AI의 위험성을 경고하고 규제를 옹호하기 위해 미국 상원 방문을 포함해 전 세계 순회를 시작했습니다.

그리고 모든 것을 마무리하기 위해 OpenAI 경영진은 AI가 인류를 멸종시킬 수 있다고 경고하는 간단한 성명에 서명했습니다.

결국, 두려움과 과대광고는 가라앉기 시작했지만, 이론적 초인적 AI가 모든 인류에게 실존적 위협이 되어 모든 사람에게 끓어오르는 불안의 기류를 가져온다고 확신하는 우발적인 사람들(많은 사람들이 효과적인 이타주의 와 연결됨)이 여전히 있습니다. 

 

 

AI 예술 생성기는 여전히 논란의 여지가 있지만 계속해서 역량이 성장하고 있습니다.

 

2023년은 이미지 합성 모델의 역량이 크게 도약한 해였습니다. 지난 3월 Midjourney는 AI 이미지 합성 모델 버전 5 를 통해 AI 생성 이미지의 포토리얼리즘을 눈에 띄게 향상시켜 다섯 손가락을 가진 사람들을 설득력있게 만들었습니다. 

Midjourney는 일년 내내 AI 예술 작품에 대한 비평가들로부터 혐오감을 불러일으켰지만 기술을 수용한 사람들의 실험 (그리고 약간의 속임수 )에도 영감을 주었습니다. 그리고 변화의 속도는 멈추지 않았습니다. 

v5.1은 5월에 출시되고 v5.2는 6월에 출시되며 각각 새로운 기능과 세부 사항이 추가됩니다. 

현재 Midjourney 는 Discord가 필요하지 않은 독립형 인터페이스를 테스트하고 있으며 Midjourney v6는 12월 말에 출시될 예정입니다.

 

또한 3월에는 공개 도메인 작업과 Adobe Stock 아카이브에 있는 이미지에 대해서만 교육을 받는 AI 이미지 생성기인 Adobe Firefly 가 출시되었습니다. 

그리고 5월 말까지 Adobe는 Generative Fill이 포함된 주력 Photoshop 이미지 편집기의 베타 버전에 이 기술을 통합했습니다.

그리고 OpenAI의 DALL-E 3는 9월에 신속한 충실도를 새로운 수준으로 끌어올려 가까운 미래의 예술가들에게 흥미로운 시사점을 제시했습니다.

 

 

AI 딥페이크는 더 깊은 영향을 미친다

2023년 내내 이미지, 오디오, 비디오 생성기의 더 넓은 의미가 자리잡기 시작했습니다.

3월에 체포된 도널드 트럼프 와 푹신한 재킷을 입은 교황 의 상당히 설득력 있는 AI 생성 이미지를 포함하여 몇 가지 논란이 나타났습니다 (그러나 스파게티를 먹는 윌 스미스는 누구도 속이지 않았습니다).

또한 그 달에는 사람들이 AI를 사용하여 사랑하는 사람의 목소리를 모방 하고 전화 통화를 통해 돈을 요구하는 사기에 대한 뉴스가 나왔습니다.

 

그리고 2022년 12월 사람들이 소셜 미디어 사진을 사용하여 딥페이크를 만들 수 있다는 기능 에도 불구하고 AI 이미지 생성 기술로 인해 6월에는 가짜 비디오를 사용하여 사람들을 협박하는 '성착취' 사기에 대해 FBI가 경고 했습니다.

지난 9월, 미국 법무장관 거의 모두가 의회에 AI 생성 CSAM의 가능성에 대해 경고하는 서한을 보냈습니다.

그리고 경고가 있은 지 약 1년 후인 11월에는 뉴저지의 십대들이 AI로 생성된 동급생 누드를 만들었다고 합니다.

그럼에도 불구하고 우리는 AI를 사용하여 거의 쉽게 모든 형태의 기록 미디어를 복제할 수 있는 빠르게 발전하는 기능의 낙진을 다루기 시작했을 뿐입니다.

 

 

AI 글쓰기 감지기는 결과를 약속하지만 작동하지 않습니다.

ChatGPT의 출현은 2023년까지 교육자들에게 실존적 위기를 가져왔고 교사와 교수들은 수업 과제에서 인간의 생각을 대체하는 합성 텍스트에 대해 걱정했습니다. 

AI로 작성된 텍스트를 감지할 수 있는 도구를 약속하면서 이러한 두려움을 활용하기 위해 기업들이 빠르게 등장했습니다. 

우리는 실제로 모든 것이 인간이 작성한 것인데도 ChatGPT를 사용하여 작업을 작성했다는 거짓 비난을 받는 사람들의 이야기를 곧 듣기 시작했습니다.

 

현재까지 AI 작성 감지기는 글쓰기에서 AI 생성 텍스트의 존재를 확인하거나 거부할 만큼 신뢰할 수 없습니다.

7월에 우리는 이것이 왜 그런지 설명하는 대규모 기능을 작성했으며 얼마 지나지 않아 OpenAI는 낮은 정확도로 인해 자체 AI 쓰기 감지기를 가져왔습니다 . 9월까지 OpenAI는 FAQ에 "일부(OpenAI 포함)가 AI 생성 콘텐츠를 감지한다고 주장하는 도구를 출시했지만 AI 생성 콘텐츠와 인간을 안정적으로 구별하는 도구는 없습니다.

- 생성된 콘텐츠." 그 이후로 AI 탐지에 대한 열광은 다소 줄어들었지만 AI로 작성된 작업을 탐지한다고 주장하는 상용 도구는 여전히 존재합니다.

 

 

AI가 생성한 '환각' Hallucinations : 할루시네이션이 주류로 자리잡다

 

2023년에는 AI '환각'(일부 AI 모델이 설득력 있게 무언가를 만들어내는 경향)이라는 개념이 올해 AI 뉴스를 지배한 대규모 언어 모델 덕분에 주류로 자리 잡았습니다. 환각으로 인해 법적 문제가 발생했습니다. 

지난 4월 ChatGPT가 Hood가 외국 뇌물 스캔들로 유죄 판결을 받았다고 허위 주장을 했을 때 Brian Hood는 명예 훼손 혐의로 OpenAI를 고소했습니다 ( 나중에 해결됨 ). 

그리고 5월에는 ChatGPT가 조작한 가짜 사건을 인용한 변호사가 체포되어 나중에 판사로부터 벌금을 물었습니다.

 

지난 4월에 우리는 왜 이런 일이 발생하는지에 대한 주요 특집을 작성했지만 회사가 어쨌든 조립하는 LLM을 출시하는 것을 막지는 못했습니다. 실제로 Microsoft는 Windows 11에 직접 구축했습니다.

연말에는 Cambridge 와 Dictionary.com 두 사전이 올해의 단어로 "hallucinate"를 선정했습니다.

물론 우리는 여전히 " confabulate "를 선호합니다. AI 관련 정의는 Cambridge Dictionary에도 나와 있습니다.

 

 

Google의 Bard는 Microsoft와 ChatGPT에 맞서 "춤"을 춥니다.

 

ChatGPT가 2022년 11월 말에 출시되었을 때 OpenAI를 포함한 모든 사람이 즉각적인 인기를 얻었습니다. 

사람들이 ChatGPT가 웹 검색을 대체할 수 있다고 불평하기 시작하자 Google은 검색 우위에 대한 이러한 명백한 위협에 대응하기 위해 2023년 1월에 조치에 뛰어들었습니다.

지난 2월 빙챗(Bing Chat)이 출시되자 마이크로소프트 CEO 사티아 나델라(Satya Nadella)는 인터뷰에서 "우리가 [구글]을 춤추게 만들었다는 사실을 사람들이 알았으면 좋겠다"고 말했다. 효과가 있었습니다.

 

Google은 2월 초에 잘못된 데모로 Bard를 발표한 후 3월에 비공개 테스트로 Bard를 출시 했으며 5월에 광범위하게 출시되었습니다 . 회사는 5월에 Bard , PaLM 2 언어 모델 , 12월 초에 Gemini를 개정 하여 OpenAI와 Microsoft를 따라잡기 위해 남은 한 해를 보냈습니다 . 춤은 아직 끝나지 않았지만 Microsoft는 확실히 Google의 관심을 끌고 있습니다.

 

 

 

OpenAI, Sam Altman을 해고하고 그는 돌아옴

 

11월 17일, 정기 검진을 받으러 의사와 통화하던 중에 전화기가 거의 쉬지 않고 계속해서 울리기 시작했습니다. 

나는 의사에게 사과하고 무슨 일이 일어나고 있는지 확인했습니다. OpenAI의 비영리 이사회는 폭탄 선언을 했습니다. 

OpenAI의 CEO인 Sam Altman을 해고했고 모든 사람(아내, 엄마, 친구, 동료)이 이에 대해 나에게 이야기했습니다. 

Ars의 Kyle Orland가 이미 나를 대신하여 취재하기 시작한 사건에 대해 글을 쓰기 위해 집으로 달려가는 동안 의사는 "정말 미친 세상이에요"라고 말했습니다.

모두를 혼란스럽게 한 OpenAI 이사회는 기습 해고의 정확한 이유를 공개하지 않았으며 Altman이 "이사회와의 의사소통에서 일관되게 솔직하지 않았다"고만 말했습니다.

그 주말에는 Greg Brockman 대통령의 연대 사임 과 해고 과정에서 OpenAI의 수석 과학자 Ilya Sutskever의 역할을 포함하여 더 많은 세부 사항이 나타났습니다. 주요 투자자인 마이크로소프트는 분노했고, 알트만은 곧 복귀 협상을 시작 했습니다.

그는 700명이 넘는 OpenAI 직원과 함께 원래 팀이 복원되지 않으면 Microsoft에 합류하겠다고 위협했습니다.

나중에 알트만이 이사 헬렌 토너를 해임하려던 시도를 처리한 것이 해고를 촉발시켰다는 사실이 드러났 습니다.

Altman은 2주 후 공식적으로 CEO로 돌아왔고 회사는 그 어느 때보다 단결했다고 주장했습니다.

그러나 혼란스러운 사건은 회사의 미래와 많은 사람들이 세상을 변화시킬 기술이라고 생각하는 것을 책임감 있게 개발하기 위해 잠재적으로 불안정한 회사(특이한 비영리/영리 구조를 가짐)에 의존하는 것의 안전성에 대한 의문을 남겼습니다.

 

 

기술이 계속해서 발전하고 있어요

2023년부터 AI와 관련된 10가지 주요 스토리를 다루었음에도 불구하고 바쁜 한 해의 표면을 거의 긁지 않은 것처럼 느껴집니다. 

지난 6월에는 위에서 말했던 AI 환각 시대에 나에게 향수를 불러일으키는 위안을 주는 마지막 인쇄본 백과사전 구입에 관해 글을 썼다. 그리고 우리는 AI가 생성한 QR 코드 , 기하학적 나선 , 정신을 뒤흔드는 맥주 광고 등 AI가 생성한 흥미로운 시각적 스토리를 다뤘습니다 .

 

그 동안 시장 선두주자로 인식된 OpenAI는 5월에 ChatGPT 앱을 출시하고 9월에 ChatGPT Plus에 이미지 인식 기능을 도입하는 등 기술적으로 결코 가만히 있지 않았습니다. 

11월에는 GPT-4 Turbo 와 GPT (AI 보조자를 위한 맞춤형 역할)가 뒤따랐고, 올해는 GPT-5 개발이 진행되면서 끝났습니다. 

구글의 제미니(Gemini) 이야기도 여전히 펼쳐지고 있다.

 

 

바쁘고 영향력 있는 한 해였습니다. 

빠르게 발전하는 이 분야를 가장 효과적으로 다룰 수 있는 방법을 찾기 위해 고심하는 동안 Ars Technica와 함께 해주신 모든 분들께 감사의 말씀을 전하고 싶습니다. 

 

2024년에 대한 우리의 예측은?

안전 벨트 매세요.