Microsoft warnt Chinas Dominanz in Schwellenländern
Microsoft-Präsident Brad Smith warnt vor „KI-Kluft“: China unterbietet US-Anbieter in Schwellenländern durch Subventionen und festigt seine Vorreiterrolle.
Prawdziwe problemy pojawiłby się, gdyby za całą sprawą stał sam Pekin, który może uznał, że „perła w koronie” chińskiego AI nie powinna być w brudnych rękach spekulantów giełdowych.
Chiny znalazły sposób na blokadę Nvidii? Alibaba i ByteDance trenują AI w Singapurze, omijając sankcje
Amerykańskie embargo na eksport najwydajniejszych akceleratorów AI do Chin miało zdusić rozwój tamtejszej sztucznej inteligencji. Chyba się nie udało.
Okazuje się jednak, że fizyczna granica nie jest przeszkodą dla danych. Jak donosi „Financial Times”, chińscy giganci technologiczni, tacy jak Alibaba i ByteDance, przenieśli proces szkolenia swoich modeli do centrów danych w Azji Południowo-Wschodniej, gdzie legalnie korzystają z zakazanych w ich ojczyźnie układów Nvidii.
Według raportu „Financial Times”, w Singapurze i Malezji trwa prawdziwy boom na centra danych. Obiekty te są wyposażane w najpotężniejsze układy Nvidii (takie jak H100 czy Blackwell), do których podmioty zarejestrowane w Chinach nie mają bezpośredniego dostępu zakupowego.
Chińskie firmy nie kupują jednak sprzętu – one go wynajmują. Podpisując umowy z operatorami data center w krajach sojuszniczych USA, Alibaba (twórca modelu Qwen) czy ByteDance (właściciel TikToka i modelu Doubao) mogą zdalnie trenować swoje algorytmy na topowym sprzęcie. To tzw. „luka chmurowa”. Przepisy kontroli eksportu dotyczą fizycznego transferu towarów, a nie przesyłu danych do przetworzenia za granicą.
„To oczywisty wybór. Potrzebujesz najlepszych chipów, aby szkolić najbardziej zaawansowane modele, a tutaj wszystko jest zgodne z prawem” – komentuje dla FT jeden z operatorów centrów danych w Singapurze.
DeepSeek zostaje w domu i stawia na Huawei
Ciekawym wyjątkiem w tej strategii jest DeepSeek. Twórca jednego z najbardziej obiecujących chińskich modeli AI przyjął inną taktykę. Zamiast uciekać za granicę, firma zacieśnia współpracę z krajowym sektorem hardware’owym, w szczególności z Huawei.
Celem tego sojuszu jest optymalizacja chińskich układów (np. serii Ascend) pod kątem trenowania LLM-ów. To strategia długoterminowa – uniezależnienie się od technologii USA, nawet jeśli obecnie oznacza to pracę na sprzęcie o generację lub dwie słabszym od rozwiązań Nvidii.
Wyścig kotka i myszkę
Sytuacja ta pokazuje, jak trudne jest egzekwowanie blokady technologicznej w zglobalizowanym świecie cyfrowym. Administracja USA (według doniesień z kwietnia br.) starała się uszczelnić przepisy, ograniczając sprzedaż nawet okrojonych chipów H20, ale „turystyka obliczeniowa” do Singapuru pozostaje otwarta. Pytanie brzmi: jak długo Waszyngton będzie tolerował ten proceder, zanim nałoży restrykcje również na udostępnianie mocy obliczeniowej w chmurze?
DeepSeek-R1 erzeugt unsicheren Code bei politisch sensiblen Begriffen
Die chinesische KI DeepSeek-R1 erzeugt schlechteren Code, wenn Begriffe wie Falun Gong oder Taiwan im Prompt stehen. Das fanden Sicherheitsforscher heraus.
DeepSeek-OCR: Wie Bilder Chatbots helfen, lange Gespräche zu führen
Chinesische KI-Forscher wollen Chatbots mit Bildern bei langen Kontexten schnell und günstig halten. Optische Kontextkompression soll KI-Assistenten verbessern.
Deepseek-R1: KI-Training hat sogar weniger als 300.000 US-Dollar gekostet
Die Konkurrenzfähigkeit der KI-Modelle von Deepseek hat Anfang des Jahres die KI-Branche schockiert. Jetzt gibt es erstmals konkrete Informationen zum Training.