OpenAI wprowadza potężną zdolność agentową, która umożliwia ChatGPT prowadzenie złożonych, wieloetapowych zadań badawczych online. Funkcja, nazwana Deep Research, osiąga w ciągu kilkudziesięciu minut to, co mogłoby zająć ludzkiemu badaczowi godziny, a nawet dni.
OpenAI opisuje Deep Research jako znaczący kamień milowy na drodze do ogólnej sztucznej inteligencji (AGI).
„Zdolność do syntezy wiedzy jest warunkiem wstępnym do tworzenia nowej wiedzy”, mówi OpenAI. „Z tego powodu Deep Research stanowi znaczący krok w kierunku naszego szerszego celu, jakim jest rozwój AGI”.
Agentowa AI umożliwia ChatGPT pomoc w złożonych badaniach
Deep Research umożliwia ChatGPT samodzielne znajdowanie, analizowanie i syntezowanie informacji z setek źródeł online. Dzięki jednemu poleceniu od użytkownika, narzędzie może dostarczyć kompleksowy raport, porównywalny z wynikami analityka badawczego, według OpenAI.
Czerpiąc możliwości z wariantu nadchodzącego modelu „o3” OpenAI, celem jest uwolnienie użytkowników od czasochłonnego, pracochłonnego zbierania informacji. Niezależnie od tego, czy chodzi o analizę konkurencyjną platform streamingowych, przegląd polityki czy nawet spersonalizowane rekomendacje dotyczące nowego roweru miejskiego, Deep Research obiecuje precyzyjne i wiarygodne wyniki.
Co ważne, każdy wynik zawiera pełne cytaty i przejrzystą dokumentację, co umożliwia użytkownikom łatwe weryfikowanie ustaleń.
Narzędzie wydaje się szczególnie biegłe w odkrywaniu niszowych lub nieintuicyjnych spostrzeżeń, co czyni je nieocenionym zasobem w branżach takich jak finanse, nauka, tworzenie polityki i inżynieria. Ale OpenAI widzi również, że Deep Research jest przydatne dla przeciętnego użytkownika, na przykład dla kupujących szukających hiperpersonalizowanych rekomendacji lub konkretnego produktu.
Ta najnowsza zdolność agentowa działa poprzez interfejs użytkownika ChatGPT; użytkownicy po prostu wybierają opcję „Deep Research” w kompozytorze wiadomości i wpisują swoje zapytanie. Można również przesyłać pliki lub arkusze kalkulacyjne w celu uzyskania dodatkowego kontekstu.
Po uruchomieniu AI rozpoczyna rygorystyczny proces wieloetapowy, który może zająć od 5 do 30 minut. Pasek boczny dostarcza aktualizacji na temat podjętych działań i konsultowanych źródeł. Użytkownicy mogą kontynuować inne zadania i zostaną powiadomieni, gdy końcowy raport będzie gotowy.
Wyniki są prezentowane w czacie jako szczegółowe, dobrze udokumentowane raporty. W nadchodzących tygodniach OpenAI planuje dalsze ulepszanie tych wyników poprzez osadzanie obrazów, wizualizacji danych i wykresów, aby zapewnić jeszcze większą przejrzystość i kontekst.
W przeciwieństwie do GPT-4o – który doskonale radzi sobie w czasie rzeczywistym, w rozmowach multimodalnych – Deep Research kładzie nacisk na głębokość i szczegółowość. Jego zdolność do rygorystycznego cytowania źródeł i dostarczania kompleksowej analizy wyróżnia go – przesuwając nacisk z szybkich, podsumowanych odpowiedzi na dobrze udokumentowane, badawcze wnioski.
Czytaj też: Menedżer haseł Google
Deep Research stworzony do wyzwań rzeczywistego świata
Deep Research wykorzystuje zaawansowane metody szkoleniowe, oparte na rzeczywistych zadaniach przeglądania i rozumowania w różnych dziedzinach. Jego model został przeszkolony za pomocą uczenia przez wzmocnienie, aby samodzielnie planować i realizować wieloetapowe procesy badawcze, w tym cofanie się i adaptacyjne doskonalenie podejścia w miarę pojawiania się nowych informacji.
Narzędzie może przeglądać przesłane przez użytkownika pliki, generować i iterować wykresy za pomocą Pythona, osadzać media, takie jak generowane obrazy i strony internetowe w odpowiedziach, oraz cytować dokładne zdania lub fragmenty ze swoich źródeł. Wynikiem tego rozległego szkolenia jest wysoce zdolny agent do rozwiązywania złożonych problemów rzeczywistego świata.
OpenAI oceniło Deep Research w szerokim zestawie egzaminów na poziomie eksperckim znanych jako „Ostatni Egzamin Ludzkości”. Egzaminy – składające się z ponad 3000 pytań obejmujących tematy od nauki o rakietach i lingwistyki po ekologię i klasykę – testują kompetencje AI w rozwiązywaniu wieloaspektowych problemów.
Wyniki były imponujące, a model osiągnął rekordową dokładność 26,6% w tych dziedzinach:
- GPT-4o: 3,3%
- Grok-2: 3,8%
- Claude 3.5 Sonnet: 4,3%
- OpenAI o1: 9,1%
- DeepSeek-R1: 9,4%
- Deep Research: 26,6% (z przeglądaniem + narzędziami Pythona)
Deep Research osiągnął również nowy stan sztuki w benchmarku GAIA, który ocenia modele AI na podstawie pytań rzeczywistego świata wymagających rozumowania, płynności multimodalnej i biegłości w używaniu narzędzi. Deep Research znalazł się na szczycie tabeli wyników z wynikiem 72,57%.
Sprawdź też: TPM 2.0
Ograniczenia i wyzwania
Chociaż zdolność agentowa AI Deep Research w ChatGPT oznacza odważny krok naprzód, OpenAI przyznaje, że technologia jest nadal w początkowej fazie i ma swoje ograniczenia.
System okazjonalnie „halucynuje” fakty lub oferuje błędne wnioski, choć w znacznie mniejszym stopniu niż istniejące modele GPT, według OpenAI. Ma również trudności z rozróżnianiem między autorytatywnymi źródłami a spekulacyjnymi treściami i ma trudności z kalibracją poziomów pewności – często wykazując nadmierną pewność co do potencjalnie niepewnych ustaleń.
Drobne błędy formatowania w raportach i cytatach, a także opóźnienia w inicjowaniu zadań, mogą również frustrować początkowych użytkowników. OpenAI twierdzi, że te problemy powinny się poprawić z czasem wraz z większym użyciem i iteracyjnymi udoskonaleniami.
OpenAI wprowadza tę zdolność stopniowo, zaczynając od użytkowników Pro, którzy będą mieli dostęp do 100 zapytań miesięcznie. Następnie będą dostępne poziomy Plus i Team, a następnie dostęp dla przedsiębiorstw.
Mieszkańcy Wielkiej Brytanii, Szwajcarii i Europejskiego Obszaru Gospodarczego nie mają jeszcze dostępu do tej funkcji, ale OpenAI pracuje nad rozszerzeniem jej wdrożenia na te regiony.
W nadchodzących tygodniach OpenAI rozszerzy funkcję na platformy mobilne i stacjonarne ChatGPT. Długoterminowa wizja obejmuje umożliwienie połączeń z subskrypcyjnymi lub zastrzeżonymi źródłami danych, co dodatkowo zwiększy solidność i personalizację wyników.
Patrząc w przyszłość, OpenAI planuje zintegrować Deep Research z „Operatorem”, istniejącą zdolnością chatbota, która podejmuje działania w rzeczywistym świecie. Ta integracja pozwoliłaby ChatGPT na płynne wykonywanie zadań wymagających zarówno asynchronicznych badań online, jak i rzeczywistego wykonania.
Czytaj też: Apetyt na wodę przez AI budzi obawy dotyczące zrównoważonego rozwoju