OpenAI, 오디오, 시각적, 텍스트 전반에 걸쳐 실시간 추론을 지원하는 업데이트 출시
2024-10-02 11:34
Odaily 스타 데일리 뉴스 OpenAI는 AI 모델이 더 나은 대화를 수행하고 이미지 인식 기능을 향상시킬 수 있도록 지난 10월 모델을 4가지 업데이트했습니다. 첫 번째 주요 업데이트는 개발자가 단일 프롬프트를 사용하여 AI 생성 음성 애플리케이션을 만들 수 있게 해주는 실시간 API로, ChatGPT의 고급 음성 모드와 유사한 자연스러운 대화를 가능하게 합니다. 이전에는 개발자가 이러한 경험을 만들기 위해 여러 모델을 "함께 연결"해야 했습니다. 응답을 수신하기 전에 오디오 입력을 완전히 업로드하고 처리해야 하는 경우가 많습니다. 이는 음성 대화와 같은 실시간 애플리케이션의 대기 시간이 길어진다는 것을 의미합니다. Realtime API의 스트리밍 기능을 통해 개발자는 이제 음성 도우미처럼 즉각적이고 자연스러운 상호 작용을 달성할 수 있습니다. API는 2024년 5월에 출시된 GPT-4에서 실행되며 실시간으로 오디오, 시각적, 텍스트 전반에 걸쳐 추론을 수행할 수 있습니다. 또 다른 업데이트에는 개발자를 위한 미세 조정 도구가 포함되어 있어 이미지 및 텍스트 입력에서 생성된 AI 응답을 개선할 수 있습니다. 이미지 기반 스피너를 사용하면 인공 지능이 이미지를 더 잘 이해할 수 있으므로 시각적 검색 및 객체 감지 기능이 향상됩니다. 이 프로세스에는 훈련에 대한 좋은 반응과 나쁜 반응의 예를 제공하는 인간의 피드백이 포함됩니다. 음성 및 시각 업데이트 외에도 OpenAI는 작은 모델이 더 큰 모델에서 학습하고 처리된 텍스트를 재사용하여 개발 비용과 시간을 줄일 수 있도록 하는 "모델 증류" 및 "힌트 캐싱"도 도입합니다. 로이터 통신에 따르면 OpenAI의 매출은 2024년 예상 37억 달러에서 내년에는 116억 달러로 증가할 것으로 예상됩니다. (코인텔레그래프)
2025-11-08 01:08
카미노: 시즌 5가 공식 출시되었으며, 시즌 4 토큰 보상은 11월 12일에 잠금 해제됩니다.
2025-11-08 00:55
Stable은 선입금 프로그램의 두 번째 단계에서 16억 달러 이상을 모금했습니다.
2025-11-08 01:08
카미노: 시즌 5가 공식 출시되었으며, 시즌 4 토큰 보상은 11월 12일에 잠금 해제됩니다.
2025-11-08 00:55
Stable은 선입금 프로그램의 두 번째 단계에서 16억 달러 이상을 모금했습니다.
Odaily 플래닛 데일리 앱 다운로드
일부 사람들이 먼저 Web3.0을 이해하게 하자
