DeepSeek의 새로운 AI 모델 뒤에 과대 광고가있는 이유 : 차트에서

DeepSeek의 새로운 AI 모델 뒤에 과대 광고가있는 이유 : 차트에서

이 그림에서 깊은 로고가 2025 년 1 월 29 일에 찍은 그림에서 볼 수 있습니다.

이 그림에서 깊은 로고가 2025 년 1 월 29 일에 찍은 그림에서 볼 수 있습니다. | 사진 크레디트 : 로이터

중국 기반의 스타트 업 DeepSeek의 최신 AI 모델, 주로 DeepSeek-R1 추론 모델은 OpenAI와 같은 거인들에 의해 지배 된 LLM (Lange Language Model)의 세계에서 저어주었습니다. 다중 벤치마킹 도구에서 OpenAI의 플래그십 O1 모델과 동등한 것 외에도 DeepSeek-R1 모델은 비용의 일부로 사용할 수 있으며 기술 세계 주문을 방해했습니다.

2025 년 1 월 28 일, Deepseek의 AI 조수는 Openai의 chatgpt를 넘어서 미국의 Apple의 App Store에서 최고급 무료 응용 프로그램이되었습니다.

DeepSeek-R1의 성능

LLM의 성능을 평가하는 데 사용되는 벤치 마크 중 하나는 57 명의 학업 과목에 걸쳐 16,000 개의 객관식 질문으로 구성된 대규모 멀티 태스킹 언어 이해 (MMLU)입니다. 일부 비판에도 불구하고 MMLU는 여전히 사용 된 저명한 벤치마킹 도구 중 하나입니다.

또한 읽기 : 이탈리아는 사용자의 데이터를 보호하기 위해 중국 AI 응용 프로그램에 대한 액세스를 차단합니다.

MMLU에서 DeepSeek-R1의 성능은 OpenAi의 O1 (및 O1 ‘Pro’) 모델과 비슷하며, 전자는 90.8을 기록했으며 후자는 아래 플롯에서 볼 수 있듯이 92.3 점을 기록했습니다. 671 억 파라미터로 확장 될 수있는 Deepseek-R1은 Meta의 플래마십 3.1 (405 억 파라미터)과 2024 년 6 월에 출시 된 Antropic의 유명한 Claude 3.5 Sonnet을 능가했습니다. 인간 도메인-출발기는 89.8 점을 달성 한 것으로 추정됩니다. MMLU.

심상

모든 사람이 모델의 GitHub 페이지에서 볼 수있는 DeepSeek의 기술 논문은 영어, 코드, 수학 및 중국어를 등급을 매기는 데 사용되는 벤치마킹 도구에서 R1의 점수를 보여줍니다.

언어

언어 전문 지식에서 Openai 및 Anthropic의 가장 강력한 모델 중에서 R1은 단순한 QA를 제외하고 대부분의 경쟁에서 경쟁적으로 수행했으며, 여기서 아래 플롯에 표시된 것처럼 O1의 47 점보다 35% 이상 낮은 30.1을 기록했습니다.

차트 시각화

암호

R1의 성능은 LiveCodeBench 벤치마킹 도구에서 최고 였지만 65.9 점수의 점수는 아래 그래픽에 표시된 나머지 테스트에서 O1 및 Claude 3.5 Sonnet과 비슷합니다. R1은 모델의 코딩 기능을 등급에 매료시키는 데 사용되는 각 도구에서 상위 2 위에 올랐습니다.

차트 시각화

수학

DeepSeek-R1은 MATH-500 및 AIME 2024에서 강력한 O1의 우수한 점수를 능가하여 전자의 경우 97.3 점, 후자의 경우 79.8 점을 능가하는 반면 OpenAI의 O1은 각각 96.4와 79.2를 기록했습니다.

차트 시각화

중국인

DeepSeek의 R1 및 V3 모델은 중국어와의 모델의 호환성을 평가하는 데 사용되는 벤치마킹 도구에서 가장 높은 점수를 받았습니다.

차트 시각화

DeepSeek-R1의 비용 효율성

모델의 가장 매력적인 측면 인 것처럼, DeepSeek-R1은 가장 가까운 라이벌 인 Openai의 O1과 비교할 때 비용의 일부만 사용자에게 제공됩니다. R1의 API (Application Programming Interface)에 액세스하려면 모델의 텍스트 상자에서 프롬프트를 공급하기 위해 발생하는 비용은 1 백만 개의 토큰에 대해 O1의 15 달러에 비해 0.55 달러에 불과합니다. ‘토큰’은 본질적으로 LLM이 처리 할 수있는 가장 작은 텍스트 데이터 (몇 문자)입니다. Claude 3.5 Sonnet은 1 백만 개의 토큰을 입력 한 경우 $ 3 (R1의 거의 6 배)입니다.

R1의 출력 비용 (모델에서 생성 된 출력 비용)은 아래 그래픽에 표시된 것처럼 OpenAi의 O1, O1-Mini, GPT 4O와 비교할 때 훨씬 저렴합니다. DeepSeek-R1의 출력 비용은 백만 토큰 당 출력 비용이 OpenAI의 O1보다 25 배 이상 저렴합니다.

차트 시각화

DeepSeek-R1의 릴리스는 글로벌 AI 부문을 방해했으며 미국에서 Nvidia가 2025 년 1 월 27 일 17% 감소함에 따라 Nvidia가 5,900 억 달러를 잃은 미국에서 가장 큰 시가 총액 손실로 이어졌습니다.

참조

You might also like