AI 생태계

볼티지 파크(Voltage Park), AI 개발을 위한 대규모 새 클라우드 출시

DobongLive 2023. 12. 1. 02:00

 

 

최첨단 ML 컴퓨팅 시장이 붕괴되었습니다. 스타트업, 연구원, 심지어 대형 AI 연구소까지 ML 훈련을 위한 최신 칩을 구입하거나 임대하기 위해 안간힘을 쓰고 있습니다. 그러나 수요는 공급을 훨씬 능가하며, 이용 가능한 것은 자원이 풍부한 사람만이 접근할 수 있어 혁신에 인위적인 방해 요소가 됩니다.

 

오늘 볼티지 파크(Voltage Park)를 론칭하며, 대기업과 연구 대학부터 초기 단계의 스타트업과 비영리 단체에 이르기까지 모든 사람이 접근할 수 있는 기계 학습 인프라를 만드는 임무를 수행하고 있습니다.

볼티지 파크(Voltage Park) CEO 에릭 박(Eric Park)은 “컴퓨팅 부족이 AI 혁신가들에게 얼마나 큰 영향을 미치는지 이해하는 사람이 충분하지 않습니다.”라고 말했습니다. “ML 팀과 AI 창립자는 모델을 교육하기 위해 최신 하드웨어에 액세스하려면 몇 달을 기다리거나 엄청난 금액을 지불해야 합니다. 우리는 이러한 불균형을 바로잡고 AI 분야의 최첨단 작업을 가속화하기를 희망합니다.”

ML 컴퓨팅 스크램블

현재 ML 컴퓨팅 시장은 생태계 전반에 걸쳐 세 가지 큰 문제를 야기하고 있습니다.

  1. 장기 계약 : 많은 제공업체는 회사가 수년 동안 대규모 컴퓨팅 클러스터를 임대하도록 하는 엄격한 계약을 맺고 있습니다. 소규모 회사에는 훨씬 더 많은 민첩성이 필요하며 종종 몇 대의 시스템만 필요합니다.
  2. 가용성 : 구매할 여유가 있는 기업은 리드 타임이 길어 경쟁업체가 지나갈 때까지 기다려야 합니다.
  3. 비용 : 대규모 클라우드 제공업체의 GPU 임대 요금은 스타트업 및 연구실이 감당할 수 없는 경우가 많습니다. 더 큰 모델을 작업하는 팀의 경우, 센트 하나하나가 중요하고 시간당 비율이 높을수록 교육 비용이 수백만 달러 더 높아질 수 있습니다.

세계 최대 규모의 ML 컴퓨팅 클라우드 중 하나 공개

약 24,000개의 NVIDIA H100 GPU를 갖춘 Boltel Park 클라우드는

세계에서 가장 강력한 최첨단 ML 컴퓨팅 컬렉션 중 하나입니다. 

 

볼티지 파크 클러스터는 3.2T InfiniBand와 완전히 상호 연결된 80GB H100 SXM5 GPU로 구성됩니다. 

 

 

볼티지 파크는 현재 최고 성능이 필요한 대규모 사용자에게 베어메탈 액세스를 제공하고 있습니다. 

 

기존 교육 프레임워크에 쉽게 통합할 수 있도록 Slurm, Kubernetes, mosaic와 같은 친숙한 도구에 대한 지원과 함께 인프라를 가동하는 즉시 단기 임대 및 시간별 청구에 대한 지원을 추가할 예정입니다. 

 

전압 공원 클러스터는 이미 Imbue를 포함한 흥미로운 AI 회사에 서비스를 제공하고 있으며 Character.ai  Atomic AI 와 같은 다른 AI 리더를 위한 클러스터를 마무리하고 있습니다. 

 

남은 컴퓨팅은 내년 초까지 온라인에 제공될 것으로 예상됩니다.

Imbue의 CEO인 Kanjun Qiu는 "Voltage Park는 다른 공급업체보다 훨씬 더 빠르게 중요한 컴퓨팅에 액세스할 수 있도록 도와주었습니다."라고 말했습니다. “우리의 교육 요구 사항은 까다롭습니다. 그리고 그들의 팀은 우리가 모델에서 최고의 성능을 얻을 수 있도록 도와주었습니다(그리고 매우 빠른 응답 지원도 제공했습니다). 그들의 인프라가 더 많은 ML 팀이 최첨단 모델을 빠르게 교육하고 배포하는 데 도움이 되기를 바랍니다.”

 

인프라를 구축하면서 우리는 실험, 교육, 미세 조정 또는 추론 등 가장 필요한 사용 사례를 지원하기 위해 클러스터를 엔지니어링할 수 있는 방법을 잠재 고객으로부터 듣고 싶습니다.

 

컴퓨팅에 관심이 있는 경우 볼티지 파크 웹사이트에 등록하여 대기자 명단에 이름을 올리세요.

공급은 선착순입니다.