DeepSeek : AI Chatbot 앱에 대해 알아야 할 모든 것

DeepSeek : AI Chatbot 앱에 대해 알아야 할 모든 것

Deepseek은 바이러스가되었습니다.

Chatbot 응용 프로그램이 Apple App Store (AI Google Play)의 최상위로 올라간 후 이번 주에 중국 AI 실험실 Deepseek가 주요 의식에 침입했습니다. 계산 기술을 사용하여 교육을받은 Deepseeek AI 모델은이 월스트리트 분석가들로 이어졌습니다. AI 경주에서 리드를 유지할 수 있는지 여부와 AI 칩에 대한 수요가 유지 될지 여부에 의문을 제기했습니다.

그러나 Deepseek은 어디에서 왔으며 어떻게 국제적 명성에서 어떻게 그렇게 빨리 성장 했습니까?

Deepseek 딜러의 기원

DeepSeek은 AI를 사용하여 무역 결정에 대해 알리는 중국 양적 헤지 펀드 인 높은 자본 관리를 지원합니다.

AI 애호가 인 Liang Weenfeng은 2015 년에 높은 ​​비행에 직면했습니다. Zhejiang University의 한 학생이 AI 알고리즘의 개발 및 배열에 중점을 둔 헤지 펀드로 고임금 자본 관리를 시작한 반면 거래로 시작한 Wenfeng은 고임금 자본 관리를 시작했습니다.

2023 년에 High-Flyer는 Deepsek을 시작하여 금융 비즈니스와 별도로 AI 도구를 탐색하기위한 실험실로 시작했습니다. 그의 투자자 중 한 사람으로서 우연한이 실험실은 DeepSeek라고도 불리는 자신의 회사에서 열렸습니다.

첫날부터 DeepSeek은 모델 용 자체 데이터 클러스터를 구축했습니다. 그러나 중국의 다른 AI 회사들과 마찬가지로 DeepSeek은 미국 수출 금지에 영향을 미쳤습니다. 최근 모델 중 하나를 훈련시키기 위해이 회사는 미국 회사가 이용할 수있는 ZIP의 덜 강력한 버전 인 Nvidia H800 칩을 사용해야했습니다.

Deepseek의 기술 팀은 젊은이들을 왜곡한다고합니다. 이 회사는 최고의 중국 대학의 AI 연구원 박사 학위를 적극적으로 고용하고 있다고한다. 뉴욕 타임즈 (New York Times)에 따르면 DeepSeek은 컴퓨터 과학이없는 사람들을 고용하여 자신의 기술이 광범위한 과목을 더 잘 이해하도록 돕습니다.

강력한 깊은 모델

DeepSeek은 2023 년 11 월에 첫 번째 모델 Deepseek 코더, DeepSeek LLM 및 DeepSeek 채팅 세트를 소개했지만 지난 봄에만 스타트 업이 다음 유전자 패밀리 DeepSeek-V2를 발표했을 때 AI 산업은 주목하기 시작했습니다.

이미지의 텍스트 및 분석의 범용 시스템 인 DeepSeek-V2는 다양한 AI 참조 값으로 잘 관리되었으며 당시 비슷한 모델보다 시작하기에는 훨씬 저렴했습니다. 그는 조별과 알리브 밥을 포함한 Deepseek의 국내 경쟁을 강요하여 일부 모델의 사용 가격을 줄이고 다른 모델은 완전히 자유롭게 만듭니다.

2024 년 12 월에 시작된 Deepseek-V3는 DeepSeek의 메모 만 추가했습니다.

Deepsek의 내부 참조 값 테스트에 따르면 DeepSeek V3는 Meta의 LLAM 및 OpenAI의 GPT-4O와 같은 API를 통해서만 액세스 할 수있는 “폐쇄 된”모델과 같은 공개적으로 사용 가능한 모델을 초과하고 다운로드합니다.

Deepseek 모델 R1 “The Resonance”도 똑같이 인상적입니다. 1 월에 출판 된 DeepSeek은 R1이 수행한다고 주장하고 주요 표준에 대한 OpenAI -OV O1 모델이 주장합니다.

설명 모델 인 R1은 사실을 효과적으로 확인하여 일반적으로 모델을 출시하는 트랩을 피하는 데 도움이됩니다. 설명 모델은 2 초에서 1 분 더 오래 지속됩니다. 이는 방해하지 않은 일반적인 모델과 비교할 때 솔루션을 제시합니다. 물리학, 과학 및 수학과 같은 영역에서 일반적으로 더 신뢰할 수 있다는 것은 거꾸로됩니다.

그러나 R1, DeepSeek V3 및 DeepSeek의 다른 모델에는 단점이 있습니다. 중국은 AI이기 때문에 중국 인터넷 규제 기관과 비교하여 대답이 “기본 사회주의 가치를 구현”할 수 있도록합니다. 예를 들어, DeepSeek의 Chatbot 앱에서 R1은 Tiananmen Square 또는 대만의 자율성에 대한 질문에 대답하지 않습니다.

파괴적인 접근

DeepSeek에 비즈니스 모델이 있으면 어떤 모델이 사실인지는 명확하지 않습니다. 회사는 시장 가치보다 훨씬 낮은 제품과 서비스를 크게 높이 평가하고 다른 사람들에게 무료로 제공합니다.

Deepseek의 말에 따르면 효율성의 침투로 인해 극도의 비용 경쟁력을 유지할 수있었습니다. 그러나 일부 전문가들은 회사가 제공 한 수치에 도전합니다.

사례에 관계없이 개발자는 문구가 일반적으로 이해되지만 상업적으로 사용할 수있는 허구의 라이센스 하에서 사용할 수 있기 때문에 오픈 소스가 아닌 DeepSeek의 모델로 전환했습니다. DeepSeek 모델을 호스팅하는 플랫폼 중 하나 인 Hugging Face 전무 이사 인 Clema Delangueu에 따르면, Hugging Face의 개발자들은 500 개가 넘는 “Detivate”R1 파생 상품을 만들었으며, 이는 250 만 개의 다운로드와 결합되어 있습니다.

더 크고 확립 된 라이벌에 대한 Deepseek의 성공은 “오름차순 AI”및 “과도하게 힙합”으로 묘사됩니다. 회사의 성공은 NVIDIA 주식의 가격을 1 월에 18% 하락하고 Openi 전무 이사 Sam Altman의 공개 대응을 얻는 데 적어도 부분적으로 책임이있었습니다.

Microsoft는 DeepSeek가 Microsoft 플랫폼 인 Foundry Azure AI에서 이용할 수 있다고 발표했습니다. Mark Zuckerberg 전무 이사는 1 분기에 AI 소비 목표에 대한 DeepSeek의 영향에 대해 AI 인프라 소비가 목표의 “전략적 이점”이 될 것이라고 말했다.

Jensen Huang 감독은 Nvidia의 4/4 분기에 돈을 버는 초청 과정에서 Deepseek의 “우수한 혁신”을 강조하면서 IT와 다른 “추론”모델은 훨씬 더 많은 계산이 필요하기 때문에 Nvidia에 탁월하다고 말했습니다.

동시에 일부 회사는 한국을 포함한 전국 및 정부뿐만 아니라 Deepseek을 금지했습니다. 뉴욕 주에서는 또한 Deepsek가 정부 장치에서 사용하도록 금지했습니다.

DeepSeek의 미래가 무엇을 할 수 있는지에 관해서는 분명하지 않습니다. 개선 된 모델은 날입니다. 그러나 미국 정부는 그가 유해한 외국의 영향으로 인식하는 것에주의를 기울인 것으로 보인다.

TechCrunch에는 게시판 AI가 있습니다! 매주 수요일에 도착한 우편으로 가져 오려면 여기에 로그인하십시오.

이 이야기는 원래 2025 년 1 월 28 일에 출판되었으며 정기적으로 업데이트됩니다.

참조

You might also like