ChatGPT

이제 모든 ChatGPT Plus 및 기업 사용자가 DALLE-3을 사용할 수 있습니다.

DobongLive 2023. 10. 22. 02:20

비전을 설명하면 ChatGPT가 구체화하고 반복할 수 있는 다양한 시각적 요소를 제공하여 비전에 생기를 불어넣습니다.

 

 

OpenAI는 자사의 가장 유능한 이미지 모델인 DALL·E 3 를 이제 ChatGPT Plus 및 Enterprise에서 사용할 수 있다고 발표했습니다 . ChatGPT의 유료 계층으로의 출시는 유해한 콘텐츠 생성을 제한하기 위해 OpenAI가 수개월 동안 테스트하고 안전을 개선한 후에 이루어졌습니다.

 

OpenAI는 DALL·E 3에 다단계 안전 시스템을 구현하여 생성된 이미지가 유해하거나 폭력적이거나 성인이거나 혐오스러운 콘텐츠를 피할 가능성을 높였다고 밝혔습니다. 

콘텐츠가 최종 사용자에게 도달하기 전에 먼저 사용자가 프롬프트를 제출할 때와 시스템이 시각적 개체를 생성할 때 철저한 안전 검사를 거칩니다.

 

 

 

OpenAI는 Microsoft Bing 팀, 전문 레드팀, 안전 연구원과 협력하여 초기 사용자 피드백을 수집하고 DALLE-3 초기 버전의 중요한 격차를 해결할 수 있었습니다. 

예를 들어, 테스터는 그래픽 콘텐츠나 현혹적으로 오해를 불러일으키는 이미지가 생성될 수 있는 극단적인 경우를 강조했습니다. 

피드백은 또한 살아있는 예술가의 스타일을 모방하거나 공인의 이미지를 생성하는 DALL-E 3의 능력을 제한하는 단계로 이어졌습니다.

 

OpenAI에 따르면 이러한 안전 가드는 사용자 피드백을 통해 지속적으로 개선될 예정입니다. 

회사는 ChatGPT 사용자에게 플래그 지정 도구를 사용하여 안전하지 않거나 부정확한 출력에 플래그를 지정할 것을 권장합니다. 

이 실제 데이터는 OpenAI가 핵심 임무에 따라 AI를 책임감 있게 훈련하는 데 도움이 됩니다.

 

OpenAI는 또한 개인이 미래 이미지 생성 모델 훈련에서 자신의 이미지를 제외할 수 있는 방법을 강조했습니다. 

GPTBot이 웹 사이트를 크롤링하지 못하도록 차단 하거나 기존 교육 데이터에서 제거하려는 OpenAI 이미지를 보내는 양식을 작성할 수 있습니다.

 

OpenAI는 또한 수정되지 않은 이미지가 DALL-E 3에서 나온 것인지 99% 이상 정확하게 식별하는 내부 도구인 "출처 분류기"의 초기 프로토타입을 작업 중이라고 밝혔습니다.

JPEG 압축으로 95% 이상의 정확도를 유지합니다. 

중요한 점은 최종 결과를 제공하지 않고 이미지가 AI로 생성되었을 가능성만 표시한다는 것입니다. OpenAI는 합성 미디어를 식별하기 위한 강력한 기술을 개발하려면 AI 업계 전반의 협력이 필요하다고 믿습니다.

 

Google과 Meta도 유사한 솔루션을 개발 중입니다. Google DeepMind는 최근 AI 생성 이미지에 눈에 띄지 않게 라벨을 붙일 수 있는 디지털 워터마킹 도구인 SynthID를 출시했습니다. 

 

한편 Meta AI는 생성 모델로 생성된 이미지를 구별하기 위해 Stable Signature 라는 눈에 보이지 않는 워터마킹 기술에 대한 연구를 발표했습니다 . 주요 AI 기업의 출처 분류기 및 워터마킹 개발은 합성 미디어의 잠재적인 오용을 해결하는 것이 우선순위임을 강조합니다.

 

OpenAI는 DALL-E 3 출시를 통해 안전과 창의적 잠재력의 균형을 맞추는 것을 목표로 합니다. 책임감 있는 테스트 및 개발을 통해 이 기술은 전문가, 예술가 및 AI 애호가에게 도움이 될 것입니다. 

OpenAI가 폭넓은 출시를 위해 DALL-E 3를 책임감 있게 준비한 방법에 대한 자세한 내용은 DALL-E 3 시스템 카드를 참조하세요.