BitcoinWorld Google DeepMind łączy Street View z Genie 3, aby tworzyć interaktywne światy AI Google DeepMind zrobiło znaczący krok w kierunku połączenia fizycznegoBitcoinWorld Google DeepMind łączy Street View z Genie 3, aby tworzyć interaktywne światy AI Google DeepMind zrobiło znaczący krok w kierunku połączenia fizycznego

Google DeepMind łączy Street View z Genie 3, aby tworzyć interaktywne światy AI

2026/05/20 02:15
4 min. lektury
W przypadku uwag lub wątpliwości dotyczących niniejszej treści skontaktuj się z nami pod adresem crypto.news@mexc.com

BitcoinWorld

Google DeepMind łączy Street View z Genie 3, tworząc interaktywne światy AI

Google DeepMind zrobiło znaczący krok w łączeniu świata fizycznego z cyfrowym, integrując obrazy Street View bezpośrednio z projektem Genie – ogólnym modelem świata firmy. Ogłoszone podczas konferencji deweloperskiej Google I/O, połączenie to pozwala użytkownikom generować interaktywne, eksplorowane środowiska zakotwiczone w rzeczywistych lokalizacjach uchwyconych przez ponad dwie dekady danych Street View.

Od Street View do symulowanej rzeczywistości

Przez 20 lat Google zebrało ponad 280 miliardów zdjęć z 110 krajów przy użyciu samochodów wyposażonych w kamery oraz trakerów montowanych na plecakach. Teraz ten ogromny zbiór danych zasila Genie 3 – model świata zdolny do generowania różnorodnych, interaktywnych środowisk 3D na podstawie podpowiedzi tekstowych lub obrazów. Jack Parker-Holder, naukowiec badacz w zespole open-endedness w DeepMind, wyjaśnił Bitcoin World, że połączenie danych ze świata rzeczywistego z symulacją generatywną otwiera potężne możliwości zarówno dla robotyki, jak i dla eksploracji przez ludzi.

„To naprawdę potężne zarówno dla agentów [i robotyki], jak i dla ludzi do zabawy" – powiedział Parker-Holder. Opisał scenariusz, w którym robot wdrożony w Londynie – mieście, które rzadko widuje słońce – mógłby być trenowany na symulowanych słonecznych dniach generowanych z danych Street View, tak aby nagły blask słońca odbity od wiktoriańskich budynków nie zakłócał jego czujników. Podobnie podróżnik planujący wizytę w Nowym Jorku zimą mógłby użyć tego narzędzia do wizualizacji zaśnieżonej wersji konkretnego bloku, dostosowując warunki pogodowe na żądanie.

Szkolenie w zakresie robotyki i autonomicznej jazdy

Genie 3 jest już używany przez Waymo, oddział Google zajmujący się samochodami autonomicznymi, do symulowania niezwykle rzadkich zdarzeń – takich jak tornada czy niespodziewane spotkania ze zwierzętami – w celu szkolenia pojazdów autonomicznych. Parker-Holder zauważył, że choć Waymo ma własny symulator skupiony na punkcie widzenia samochodu, integracja Street View pozwala na zmianę perspektywy na innych agentów, takich jak piesi lub roboty dostawcze, umożliwiając bardziej kompleksowe scenariusze szkoleniowe.

Możliwość zakotwiczenia symulacji w rzeczywistych lokalizacjach geograficznych mogłaby przyspieszyć ekspansję Waymo do nowych miast na całym świecie, zapewniając jego kierowcy AI kontakt z różnorodnymi układami dróg, oznakowaniem i warunkami środowiskowymi bez konieczności fizycznego wdrażania floty.

Wciąż eksperyment z możliwościami rozwoju

Mimo imponujących demonstracji – w tym podwodnej symulacji dzielnicy – technologia pozostaje eksperymentalna. Diego Rivas, kierownik produktu w DeepMind, ostrzegł, że Street View w Genie jest nadal w fazie rozwoju. W próbkach pokazanych dziennikarzom środowiska były rozpoznawalne, ale o jakości gry wideo, a nie fotorealistyczne. Modelom brakuje również świadomości fizyki: w jednej symulacji kobieta biegnąca przez zaśnieżoną scenę w Joshua Tree przebiegała wprost przez kaktusy i krzewy.

Parker-Holder przyznał, że istnieje luka, porównując obecną dokładność Genie do tej, jaką osiągały modele generowania wideo sześć do dwunastu miesięcy temu. „Myślę, że to coś, co rozwiążemy" – powiedział, zauważając, że rozumienie fizyki wyłania się intuicyjnie poprzez pasywną obserwację, podobnie jak uczą się żywe istoty.

Jonathan Herbert, dyrektor Google Maps i 12-letni weteran Street View, podkreślił, że prawdziwym przełomem jest ciągłość przestrzenna. Gdy użytkownik obraca się o 360 stopni, AI poprawnie zapamiętuje i symuluje środowisko za nimi, a następnie buduje nowe środowiska na podstawie tego rozumienia. „Od dawna myśleliśmy o tym, jak możemy zbudować najlepszy i najbogatszy model świata na bazie danych Street View" – powiedział Herbert.

Dostępność i kolejne kroki

Google uruchamia Street View w Genie dla wybranych użytkowników Ultra w Stanach Zjednoczonych od dziś, z szerszym dostępem w USA stopniowo rozszerzanym w czasie. Globalni użytkownicy Ultra uzyskają dostęp w ciągu najbliższych kilku tygodni. Celem badaczy, według Rivasa, jest udostępnienie tej możliwości jak największej liczbie osób, choć podkreślił, że poprawa dokładności pozostaje priorytetem.

Podsumowanie

Łącząc dwie dekady obrazów ze świata rzeczywistego z generatywną AI, Google DeepMind kładzie podwaliny pod nową klasę interaktywnych symulacji. Choć wciąż we wczesnym stadium, integracja Street View z Genie 3 stanowi znaczący krok w kierunku systemów AI, które mogą rozumieć, symulować i wchodzić w interakcje ze światem fizycznym – z implikacjami dla robotyki, autonomicznej jazdy, urbanistyki i immersyjnej edukacji.

FAQ

P1: Czym jest Genie 3?
Genie 3 to ogólny model świata Google DeepMind, który może generować interaktywne, eksplorowane środowiska 3D na podstawie podpowiedzi tekstowych lub obrazów. Jest zaprojektowany do szkolenia robotów, gier i doświadczeń edukacyjnych.

P2: Jak działa integracja Street View?
Integracja pozwala Genie 3 korzystać z ogromnego zbioru danych obrazów Street View Google – ponad 280 miliardów zdjęć ze 110 krajów – jako podstawy do generowania symulacji zakotwiczonych w rzeczywistych lokalizacjach. Użytkownicy mogą interaktywnie eksplorować te środowiska i dostosowywać warunki takie jak pogoda.

P3: Czy symulacja jest fizycznie dokładna?
Jeszcze nie. Obecna wersja nie ma świadomości fizyki, co oznacza, że obiekty mogą nie wchodzić ze sobą w realistyczne interakcje (np. postać przebiegająca przez stałe obiekty). Google spodziewa się, że poprawi się to w ciągu najbliższych 6–12 miesięcy, gdy model nauczy się fizyki intuicyjnie dzięki większej ilości danych.

Ten post Google DeepMind łączy Street View z Genie 3, tworząc interaktywne światy AI pojawił się po raz pierwszy na BitcoinWorld.

Okazja rynkowa
Logo Gensyn
Cena Gensyn(AI)
$0,03413
$0,03413$0,03413
-%2,17
USD
Gensyn (AI) Wykres Ceny na Żywo
Zastrzeżenie: Artykuły udostępnione na tej stronie pochodzą z platform publicznych i służą wyłącznie celom informacyjnym. Niekoniecznie odzwierciedlają poglądy MEXC. Wszystkie prawa pozostają przy pierwotnych autorach. Jeśli uważasz, że jakakolwiek treść narusza prawa stron trzecich, skontaktuj się z crypto.news@mexc.com w celu jej usunięcia. MEXC nie gwarantuje dokładności, kompletności ani aktualności treści i nie ponosi odpowiedzialności za jakiekolwiek działania podjęte na podstawie dostarczonych informacji. Treść nie stanowi porady finansowej, prawnej ani innej profesjonalnej porady, ani nie powinna być traktowana jako rekomendacja lub poparcie ze strony MEXC.

No Chart Skills? Still Profit

No Chart Skills? Still ProfitNo Chart Skills? Still Profit

Copy top traders in 3s with auto trading!