W czerwcu 2025 roku firma OpenAI wprowadziła funkcję o nazwie Record Mode. Jest to asystent spotkań oparty na sztucznej inteligencji, wbudowany bezpośrednio w aplikację komputerową ChatGPT dla użytkowników Team. Nagrywa on głos, transkrybuje spotkanie w czasie rzeczywistym i przedstawia jego podsumowanie. Jeden z naszych założycieli, Rapha, bardzo wcześnie zapoznał się z tym narzędziem i tutaj można sprawdzić, co o nim sądzi.

Ja jednak, jako osoba intensywnie korzystająca z ChatGPT, chciałem nieco głębiej zagłębić się w temat„ChatGPT do sporządzania notatek ze spotkań”.

Pochodzę ze środowiska redakcyjnego i sprzedażowego, pracuję w branży sztucznej inteligencji i, szczerze mówiąc, mam obecnie niemal paraspołeczny związek z ChatGPT.

To mój partner do burzy mózgów, moja maszyna do tworzenia konspektów, mój prywatny notatnik, a czasem także miejsce, gdzie zapisuję listę zakupów. Pomógł mi wybrać trzy ostatnie prezenty urodzinowe dla mojego partnera. Zagłębiamy się w szczegóły.

Kiedy więc nagle pojawił się wbudowany rejestrator spotkań, zaciekawiło mnie to.

Nie chodzi tylko o to, co robi, ale także oto, co zakłada i jak prowadzi rozmowę.

Ponieważ używam również narzędzi takich jak tl;dv (najlepszy asystent spotkań, lol), inne narzędzia wspomagające spotkania i wiem, z czym wiąże się nagrywanie prawdziwych rozmów, z prawdziwymi ludźmi, na temat prawdziwych spraw.

Im więcej testowałem tryb nagrywania ChatGPT, tym bardziej wydawał mi się on nieco... niepokojący. Nie dlatego, że jest zły... w rzeczywistości jest dość zgrabny, prosty i intuicyjny.

Ale z powodu tego, co po cichu pomija:

  • Prywatność
  • Zatrzymywanie danych


A fakt, że oddajesz swój głos, mając bardzo niewielką kontrolę lub możliwość śledzenia

Eeek! Zagłębię się w to nieco bardziej, ale najpierw, jak w ogóle używać ChatGPT do sporządzania notatek ze spotkań, skoro istnieje tryb nagrywania?

Spis treści

Jak korzystać z ChatGPT do sporządzania notatek ze spotkań: podstawy

Aby skonfigurować ChatGPT do sporządzania notatek ze spotkań, potrzebujesz:

  • Subskrypcja ChatGPT Team
    (Koszt wynosi 25 USD/użytkownika/miesiąc, rozliczany jest raz w roku i wymaga co najmniej dwóch stanowisk. Nie ma możliwości korzystania z niego samodzielnie).
  • Aplikacja ChatGPT na komputery z systemem macOS
    (Tryb nagrywania jest dostępny tylko na komputerach Mac. Nie jest jeszcze obsługiwany przez system Windows ani przeglądarki internetowe).
  • Odblokowane miejsce pracy z włączonym trybem nagrywania
    (Administratorzy mogą przełączać to ustawienie, ale nie ma jeszcze możliwości precyzyjnej kontroli).

Pobrałem aplikację, utworzyłem nowy zespół i skonfigurowałem wszystko w mniej niż 5 minut. ChatGPT chętnie przyjął moją kartę i to było wszystko: byłem gotowy!

Nie było żadnego wprowadzenia do trybu nagrywania, żadnego banera ani ogłoszenia. Tylko cicha, mała, szara ikona mikrofonu na pasku czatu.

Kliknięcie powoduje otwarcie niewielkiego interfejsu nagrywania (bardzo podobnego do asystenta spotkań AI Notion). Nagrywa on Twój głos, przechwytuje dźwięk systemowy i rejestruje wszystko, co znajduje się w pobliżu mikrofonu. Ty mówisz. On transkrybuje. Po naciśnięciu przycisku stop podsumowuje. Masz również możliwość wstrzymania nagrywania w interfejsie.

Ogólnie rzecz biorąc, jest to dość proste.

czat gpt do sporządzania notatek ze spotkań PRZYCISK NAGRYWANIA
Przycisk nagrywania w Chat GPT

Wygenerowanie notatek zajęło około minuty, a następnie można potraktować wynik jako coś w rodzaju sesji pytań i odpowiedzi.


Następnie można przewijać Canvas, zadawać ChatGPT pytania dotyczące tego, co zostało powiedziane, tak jak w przypadku każdego innego czatu. Jest przejrzysty, jasny i, w typowym stylu OpenAI, sprawia wrażenie zaskakująco skromnego.

czat gpt do sporządzania notatek ze spotkań RECORDER
Wyskakujące okienko „Rekord”
czat gpt do sporządzania notatek ze spotkań ŁADOWANIE
Po nagraniu ładowanie trwa około minuty.

Więc, dostajesz transkrypcję?

Tak, transkrypcja istnieje... technicznie rzecz biorąc. Ale nie jest łatwo nią zarządzać. Nie ma jasnej opcji pobierania, nie ma uporządkowanego podsumowania, które można by wyeksportować. Po prostu... kręci się w wątku czatu jak dziwny sen, który pamiętasz tylko częściowo. A bez możliwości odtworzenia wideo lub audio trudno jest zidentyfikować, jak ostatecznie wyglądała. 

Kilka razy poprosiłem ChatGPT o konkretne informacje i otrzymałem różne odpowiedzi:

  • Pewnego razu pokazało mi to z grubsza fragment tego, co powiedziałem.
  • Innym razem wypluło coś, co wyglądało jak kod zastępczy, zmieszany z notatkami sztucznej inteligencji.
  • Kiedyś pojawiło się odniesienie do czegoś o nazwie „Hive”, co sprawiło, że zacząłem się zastanawiać, czy przypadkiem nie wywołałem integracji zaplecza, czy też po prostu całkowicie się pogubiłem.

 

Wtedy zacząłem się zastanawiać, jak dobrze rozumie to, co się dzieje. Przetestowałem to więc na kilka różnych sposobów:

  1. Mówiłem głośno, w trybie pełnego strumienia świadomości.
  2. Otworzyłem clip Gollumem na YouTube.
  3. Rozmawiałem normalnie z kimś w moim domu, podczas gdy ChatGPT nadal nagrywał.

Chciałem zobaczyć, co wychwyciło, co zignorowało i czy potrafiło odróżnić mój głos od głosu innej osoby.

Oto, co się wydarzyło...

czat gpt do sporządzania notatek ze spotkań dziwactwa ula
Pobierało cytaty, ale mieszało je z kodem.

Stało się… dziwnie

Pierwszą rzeczą, jaką zrobiłem, było nagranie siebie samego rozmawiającego z... cóż, samym sobą. Po prostu strumień świadomości, głośne myślenie.

Podsumowanie ChatGPT potraktowało to jako rozmowę dwóch osób. Rozpoznało różne głosy i perspektywy, mimo że to tylko ja zmieniałem ton w trakcie wypowiedzi. Trochę to niepokojące, ale fascynujące.

Pomyślałem wtedy: „No dobrze, to może nie być zbyt dobre”.

czat gpt do sporządzania notatek ze spotkań FRAGMENT ROZMOWY
Chat GPT uznał, że jestem dwiema różnymi osobami.

Drugim testem, który przeprowadziłem, było odtworzenie clip YouTube clip ktoś rozmawia sam ze sobą, aby sprawdzić, czy uda mi się to powtórzyć. Konkretnie odtworzyłem clip Gollumem z filmu „Władca Pierścieni”, ten kultowy fragment, w którym Gollum kłóci się sam ze sobą. Chciałem sprawdzić, czy ChatGPT ponownie się pogubi, czy też dostrzeże tę dwoistość.

Jednak stało się to bardziej inteligentne.

Chociaż nie zostało to wyraźnie powiedziane, rozpoznało ten głos jako głos Golluma i chociaż nie stwierdzono wprost, że „jest to clip Władca Pierścieni”, to po naciskaniu na odpowiedź odniosło się do niego i poprawnie zidentyfikowało ton i postać.

Co dziwne, wydawało się nieco zirytowane tym, że próbowałem je oszukać.

Wydawało mi się, że streszczenie miało w sobie coś z pasywno-agresywnej energii typu „niezła próba”, jakby wiedziało, że je testuję. Prezentowało notatki tak, jakbym studiował film, i oferowało pomoc w omówieniu poruszanych w nim tematów.

Powiem jednak, że pomimo tego kontekstu nadal nazywał „hobbity” „hobbils”. Gollum ma dość silny akcent i najwyraźniej sprawiało mu to trudności.

Następnie spróbowałem przeprowadzić rozmowę w moim domu, konkretnie z moim dzieckiem (którego wcześniej poprosiłem o zgodę).

W naszej krótkiej rozmowie poruszyliśmy temat zgody i tego, co oznacza nagrywanie kogoś, oraz tego, czy robienie tego w miejscu publicznym bez uprzedzenia jest w porządku.

Rezultat? Recorder firmy OpenAI:

  • Zidentyfikował mnie po imieniu, mimo że nie podałem go podczas nagrywania... ani nawet podczas całej interakcji z tym nowym kontem. Nie było ono powiązane z kontem, ponieważ była to skrócona wersja mojego imienia...
  • Zidentyfikowano mówcę 2 jako dziecko
  • Założyliśmy, że łączy nas relacja rodzic-dziecko na podstawie użytych słów (które nie były specyficzne dla tych ról).
  • Przeprowadzono analizę nastrojów i relacji na podstawie tonu i treści rozmów.

Wszystko to wynika z krótkiej rozmowy w moim biurze, co jest interesujące... ale też niepokojące.

Ponieważ w tej rozmowie omówiliśmy szerszy kontekst.

O kawiarniach, miejscach publicznych i tym, co się stanie, jeśli ktoś zacznie korzystać z tej funkcji na zewnątrz, na swoim laptopie (a może nawet później na telefonie), podczas spotkania, rozmowy, nie informując o tym nikogo. Cała ta rozmowa została zarejestrowana, przeanalizowana i zapisana jako część podsumowania. Nie ma oczywistego sposobu, aby ją trwale usunąć. Nie ma też oczywistego sposobu, aby uzyskać na to zgodę.

Oczywiście, technicznie rzecz biorąc, inni asystenci spotkań również mogliby to zrobić. Różnica polega jednak na tym, że ten asystent jest bezpośrednio podłączony do ekosystemu OpenAI, firmy o niezwykłym dostępie, zasięgu i niejasnym statusie prawnym.

To właśnie zmienia sytuację.

UWAGA REDAKCJI: Chwileczkę... Czy w ogóle powinienem tego używać?

Zanim przejdę do kwestii prywatności danych, powiem, że wtedy sprawy stały się jeszcze bardziej dziwne!

Mieszkam w Wielkiej Brytanii i zgodnie z informacjami podanymi przez samą aplikację ChatGPT nie powinienem mieć możliwości korzystania z trybu nagrywania.

Nie korzystam z VPN. Nie ma żadnych hacków. Korzystam tylko ze zwykłej subskrypcji Team na komputerze Mac.

Kiedy sprawdzałem fakty zawarte w tym artykule, zapytałem ChatGPT o dostępność regionalną, a on odpowiedział (bardzo radośnie i pomocnie), że tryb nagrywania nie jest obecnie dostępny w Wielkiej Brytanii ani w całym EOG ze względu na obawy związane z RODO.

Co jest… niezręczne. Ponieważ właśnie z niego skorzystałem. Na tym samym komputerze. W Wielkiej Brytanii.

Być może jest to halucynacja ze strony ChatGPT. A może jest to niespójność wdrożeniowa. Tak czy inaczej, jest to dziwne. Kiedy samo narzędzie informuje, że to, co robisz, nie powinno być możliwe, zaczynasz się zastanawiać, gdzie są granice.

Kto ma dostęp? Kto nie powinien mieć dostępu? I ile osób korzysta z funkcji, które technicznie rzecz biorąc nie zostały jeszcze „uruchomione” w ich regionie? Zwłaszcza tych, które są wstrzymywane ze względów „prawnych”.

To przypomina nam, że mamy do czynienia z systemami, które nieustannie się zmieniają, czasem szybciej niż jest w stanie nadążyć ich dokumentacja. A kiedy system ten rejestruje również nasz głos, podsumowuje ton wypowiedzi i formułuje założenia na temat tego, kim jesteśmy... to powinno dać nam wszystkim do myślenia.

Gdzie trafiają wszystkie te dane?

W tym samym czasie, gdy OpenAI wprowadziło nową funkcję nagrywania, w sieci pojawiło się wiele dyskusji na temat niedawnego postanowienia sądu, które zmienia sposób przetwarzania danych użytkowników.

W maju 2025 r. amerykański sąd federalny wydał nakaz, który wymaga od OpenAI przechowywania wszystkich danych. Obejmuje to logi czatów, żądania API, sesje tymczasowe i usunięte rozmowy.

Wynika to z toczącej się sprawy dotyczącej praw autorskich, wniesionej przez The New York Times i innych wydawców, którzy uważają, że dowody niewłaściwego wykorzystania treści mogą znajdować się w usuniętych logach użytkowników.

Kiedy „tymczasowe” nie jest tymczasowe

Co to oznacza w praktyce?

Nawet jeśli korzystasz z ChatGPT w trybie tymczasowym lub usuniesz rozmowę i wyłączysz opcję szkolenia w ustawieniach, OpenAI nadal musi przechowywać te dane ZGODNIE Z PRAWEM.

 

OpenAI zgłosiło sprzeciw wobec tego nakazu. Powołało się na kwestie prywatności, minimalizację danych oraz fakt, że nakaz ten może być niezgodny z przepisami międzynarodowymi. Jednak w trakcie rozpatrywania sprzeciwu dane nadal są zatrzymywane.

Dotyczy to wszystkich, nie tylko użytkowników z USA. Jeśli mieszkasz w Wielkiej Brytanii, Europie, regionie Azji i Pacyfiku, Afryce lub Ameryce Południowej, prawdopodobnie oczekujesz poziomu ochrony danych, który nie jest już gwarantowany. Rozporządzenia takie jak RODO dają ludziom prawo do usunięcia swoich danych. Obecnie OpenAI nie jest w stanie tego zapewnić.

Jeśli nagrywasz spotkania w ChatGPT, czy to dla wygody, czy też dlatego, że jest to wbudowane w Twój proces pracy, powinno to mieć znaczenie. Nie tylko korzystasz z narzędzia, ale także zasilasz system, który podlega bezpośredniej kontroli prawnej i możesz nie być w stanie odzyskać swoich danych.

Porozmawiajmy teraz o prawdziwym ryzyku

Narzędzia takie jak tryb nagrywania wyglądają na proste. Działają dyskretnie w aplikacji, transkrybują wypowiedziane słowa i przekształcają je w uporządkowaną formę. Jednak po pewnym czasie staje się jasne, że nie chodzi tylko o zapisywanie notatek. Rejestrujesz ton, emocje, intencje, przebieg rozmowy, a nie tylko słowa.

Zbierasz ludzkie emocje, spostrzeżenia, swoją „esencję”… Brzmi to trochę przesadnie, ale to właśnie te rzeczy czynią nas ludźmi.

Jeśli nagrywasz coś nieformalnego, co później staje się czymś ważnym, lub po prostu zapisujesz myśli, które dotyczą więcej niż jednej osoby, nie zawsze jest oczywiste, gdzie te dane trafią. To, co zaczyna się jako udogodnienie, może szybko stać się czymś trudniejszym do śledzenia lub zarządzania.

Inne narzędzia do spotkań mogą przechowywać poufne rozmowy, ale większość z nich jest stworzona właśnie do tego. Są bardziej przejrzyste, jeśli chodzi o to, co się dzieje, kto ma do tego dostęp i co jest zapisywane.

Nie chodzi tu o sprzeciwianie się sztucznej inteligencji. Pracuję w tej branży. Firma, w której pracuję, tworzy asystenta spotkań wykorzystującego sztuczną inteligencję i tak, przechowujemy również dane. Ale projektujemy z myślą o tym celu. Zgoda jest częścią doświadczenia, a infrastruktura opiera się na przejrzystości i kontroli użytkownika. (Co, dla przypomnienia, było tylko przypisem podczas konfigurowania systemu... w Chat GPT nie ma żadnych monitów przypominających użytkownikom o konieczności uzyskania zgody).

Zanim zacząłem pracować w branży sztucznej inteligencji, byłem dziennikarzem. Pisałem dla krajowych i międzynarodowych mediów i przez lata zajmowałem się niuansami prawnymi. Obejmowały one takie kwestie, jak zniesławienie, błędne przypisanie autorstwa i nieuprawniony dostęp do danych. Kiedy więc widzę coś, co rejestruje rozmowę, przechowuje wynik jako transkrypcję i nie oferuje jasnej ścieżki audytu ani dowodów, zaczynam się zastanawiać, co to oznacza.

Na przykład, jeśli cytat pochodzi z podsumowania spotkania i nie ma możliwości potwierdzenia, że miało ono miejsce, czy nadal się liczy? Jeśli ktoś jest nagrywany bez swojej wiedzy, a dane te pozostają w użyciu, kto ponosi za to odpowiedzialność? A jeśli treść ta trafia do systemu, który generuje wyniki dla kogoś innego, czy jest to tylko funkcja... czy coś więcej?

Czy można zostać pozwanym za coś, co według sztucznej inteligencji powiedziałeś, ale zostało to źle zrozumiane? Czy popełniasz zniesławienie, jeśli nie ma możliwości udowodnienia, czy to zrobiłeś, czy nie? Jeśli nie ma nagrania wideo, które to potwierdza, ani dodatkowej weryfikacji, co się stanie?

To nie są tylko hipotetyczne scenariusze. Zaczynają one przypominać rzeczywistość, w którą wkraczamy.

A więc ChatGPT do sporządzania notatek ze spotkań… Czy warto z niego korzystać?

Jeśli już korzystasz z ChatGPT na co dzień, a Twoje spotkania mają charakter osobisty lub są stosunkowo mało istotne, tryb nagrywania prawdopodobnie okaże się przydatny. Jest prosty, szybki, a podsumowania są przejrzyste. Fakt, że jest wbudowany, sprawia, że niezwykle łatwo jest go ustawić jako domyślny.

Jeśli jednak spotkania dotyczą klientów, decyzji zespołu, strategii lub innych wrażliwych kwestii, warto się zastanowić, zanim naciśniesz przycisk nagrywania.

Pomimo tego, jak jest przedstawiany, tryb nagrywania nie jest przeznaczony WYŁĄCZNIE do spotkań. Stanowi on część znacznie większego systemu, który został zaprojektowany tak, aby reagować na niemal wszystko, co mu się przedstawi. Ta elastyczność sprawia, że jest on TAK potężnym narzędziem, ale jednocześnie utrudnia ustalenie, co jest przechowywane, w jaki sposób przetwarzane są wypowiedzi użytkownika i czego system się z nich uczy.

Jest to łatwe i oparte na szlachetnej idei „udostępnienia sztucznej inteligencji wszystkim”, ale trudno jest sprawdzić, gdzie trafiają dane użytkownika i jak długo tam pozostają.

A to dopiero początek możliwości tego rozwiązania.

Nawet bez nieuniknionego przejmowania ziemi przez wielkie firmy technologiczne, podstawy tego są już dziwne. Podczas testów z kolegami żartowałem nawet, że Google i OpenAI zaczynają przypominać Autoboty i Decepticony z Transformersów, dwie potężne siły przybywające na Ziemię, aby walczyć o dominację, niszcząc wszystko na swojej drodze, podczas gdy my wszyscy stoimy wokół i zastanawiamy się, czy powinniśmy kibicować, czy uciekać.

Może to zabrzmieć dramatycznie, a nawet nieco dziecinnie, ale jeśli przekazujesz swój głos, kontekst, myśli i rozmowy, ma znaczenie, kto ich słucha. Ma też znaczenie, co mogą z nimi zrobić. W tej chwili nie jest jasne, kto to jest, ani kim ta osoba lub osoby będą w przyszłości.

Nadal bardzo lubię Chat GPT. 


I nadal będę z niego korzystać. Nadal będę „zaawansowanym użytkownikiem” i będę płacić za konto Pro, JEDNAK, jak w przypadku każdego narzędzia, jestem ostrożny w kwestii tego, co do niego wrzucam. Muszę wprowadzić kontrole i audyty, nie będę wrzucać do niego swojego DNA (niektórzy ludzie to robią) i nadal będę z radością korzystać z tl;dv do sporządzania notatek ze spotkań. 

Tak więc, chociaż Chat GPT do sporządzania notatek ze spotkań może okazać się niesamowitym narzędziem, nadal wydaje się, że przekazujesz wszystkie szczegóły dotyczące siebie, swojego głosu, osobowości i nie tylko, zamaskowanemu nieznajomemu. 

Podczas spotkań korzystam tl;dv. Daje mi to kontrolę. Wiem, co jest nagrywane, jak jest przechowywane i co mogę z tym zrobić później. Być może nie jest to wspierane przez potężny silnik Open AI, ale zostało stworzone właśnie do tego celu.

Możesz wypróbować go za darmo.