Deepseek v3.2... nowy otwarty SOTA (1 grudnia)
Uproszczony przepływ informacji Przed chwilą analizowałem wydanie deepseek w metrze...
Poniżej szybkie podsumowanie,
1/ Wydanie Deepseek tym razem przyniosło naprawdę imponujące rezultaty.
- Bez wątpienia open-source SOTA;
- Wszystkie zdolności praktycznie odpowiadają najnowszym, zamkniętym modelom;
2/ Od strony technologicznej nie jest to bardzo nowe,
- Nadal korzysta się z DSA + post train, udział powyżej 10% to już nie jest wielka nowość;
- Nowością jest to, że używając tych samych rzeczy z poprzedniej wersji v3.2 uzyskano tak dobre efekty, że można bezpośrednio konkurować z gemini3.0, najnowszym SOTA na rynku;
- Obecnie publikacje naukowe coraz trudniej napędzają narrację rynkową; tym razem możliwości są bardziej namacalne.
3/ Największa obawa — załamanie mocy obliczeniowej? Nie istnieje.
Zgodnie z wypowiedzią deepseek,nadal mamy dystans do najbardziej zaawansowanych modeli.
Z innej perspektywy, "fosy wiedzy" na poziomie modelu są iluzoryczne,moc obliczeniowa pozostaje czynnikiem różnicującym.
Pogląd badacza Deepseek Zhibin Gou; gemini3 udowodnił pretrain...deepseek 3.2 udowodnił RL;
Kontynuować skalowanie na każdym poziomie; nie pozwól, aby szum pesymistów zakłócał postępy.
Cięższe RL, dłuższe CoT, większe zużycie mocy obliczeniowej podczas wnioskowania;nie doprowadzi to do narracji o deflacji mocy obliczeniowej.
4/ Z perspektywy zastosowań... na pewno jest to korzystne. Cytując użytkownika z Gwiezdnej Społeczności,
-
"Zapotrzebowanie na moc obliczeniową jest nieskończone, obecne koszty tokenów mają niewielką wartość użytkową, tylko dzięki innowacjom sprzętowym i modelowym można geometrycznie obniżyć koszty i osiągnąć masowe zastosowanie"
-
Dla firm, które chcą budować "fosę aplikacyjną" na bazie możliwości modelu (np. pewien OAI),to poważne osłabienie narracji.
5/ Deepseek twierdzi, że efektywność wykorzystania tokenów jest "inferior"...W wersji Speciale zużyto ich więcej... (czerwona ramka tam)...
6/ Jako ciekawostka, Zhibin Gou powiedział, że spędzili rok doprowadzając v3 do granic możliwości... niektórzy użytkownicy w czacie Gwiezdnej Społeczności uważają, że wycisnęli już wszystko z v3,czy następna wersja to wreszcie v4?
7/ Dziś wydaje się, że przypada 3. rocznica uruchomienia ChatGPT...
Dziś wieczorem rynek prawdopodobnie będzie bardzo zmienny... japońskie czynniki makro + BTC wprowadzają zamieszanie;
Następnym małym katalizatorem może być re:invent Amazona; rano w grupie były też krótkie przewidywania.
Zastrzeżenie: Treść tego artykułu odzwierciedla wyłącznie opinię autora i nie reprezentuje platformy w żadnym charakterze. Niniejszy artykuł nie ma służyć jako punkt odniesienia przy podejmowaniu decyzji inwestycyjnych.
Może Ci się również spodobać
Trump ponownie wprowadza zamieszanie wśród brytyjskich producentów samochodów
Duzi inwestorzy bitcoin zgromadzili więcej monet niż kiedykolwiek od czasu krachu FTX w 2022 roku
