AI in healthcare: navigating the noise – Kompleksowy przewodnik wspierający liderów opieki zdrowotnej w zrozumieniu sztucznej inteligencji i odkrywaniu sztuki możliwości.

Przetłumaczony z oryginalnego źródła NHS Confederation dostępnego TUTAJ. 

Szybki rozwój sztucznej inteligencji (AI) w 2023 r. sprawił, że znalazła się ona w centrum uwagi, wywołując coraz więcej pytań o to, w jaki sposób można ją wykorzystać do wspierania systemu opieki zdrowotnej. Dobrze wdrożona i w odpowiednich kontekstach sztuczna inteligencja może potencjalnie pomóc systemowi opieki zdrowotnej w przezwyciężeniu szeregu wyzwań.

Ponieważ dziedzina sztucznej inteligencji ewoluuje w szybkim tempie, niniejszy elementarz został opracowany w celu wsparcia organizacji opieki zdrowotnej w poruszaniu się w szumie. Przeznaczony dla członków zarządu i szerszych zespołów, demistyfikuje język sztucznej inteligencji i pokazuje, w jaki sposób organizacje i systemy z niej korzystają – i w jakim celu. Ponieważ coraz więcej organizacji bada potencjał sztucznej inteligencji, niniejszy elementarz sugeruje również, w jaki sposób można wykorzystać wczesne rozmowy z dostawcami, aby rozważyć, czy rozwiązanie AI jest tym, czego potrzebujesz.

Należy pamiętać, że nie wszystkie definicje mają powiązany przykład, ponieważ w wielu przypadkach przykład byłby powtórzeniem definicji. 

 

Podstawowe pojęcia

  • Automatyzacja/robotyczna automatyzacja procesów (RPA) – wykorzystanie specjalistycznego oprogramowania i technologii do wykonywania powtarzalnych zadań, zgodnie z zestawem instrukcji i przepływów pracy określonych przez ludzi. Zadania te zazwyczaj pozostają spójne w czasie i obejmują takie działania, jak wysyłanie przypomnień o spotkaniach, powiadomień o nieodebranych spotkaniach, a nawet paragonów po zakupach online. Jeśli zadanie nie jest wyraźnie określone w instrukcjach, maszyna nie może go wykonać. 

Przykład: W opiece zdrowotnej automatyzacja obejmuje monitorowanie pacjentów, zarządzanie lekami i zadania administracyjne w szpitalach i klinikach.

  • Algorytm – zestaw dobrze zdefiniowanych reguł lub procesów używanych przez system sztucznej inteligencji do wykonywania zadań, takich jak odkrywanie nowych spostrzeżeń, identyfikowanie wzorców, przewidywanie wyników i rozwiązywanie problemów.
  • Sztuczna inteligencja (AI) – zdolność systemu komputerowego do naśladowania ludzkich funkcji poznawczych, takich jak uczenie się, rozwiązywanie problemów, interpretowanie informacji wizualnych, rozumienie i reagowanie na język mówiony lub pisany. Sztuczna inteligencja wykorzystuje matematykę, logikę i wzorce wyuczone na podstawie danych do symulowania ludzkiego rozumowania oraz podejmowania decyzji i rekomendacji. 

Przykład: W opiece zdrowotnej sztuczna inteligencja może być wykorzystywana do usprawniania procesów diagnostycznych, personalizowania planów leczenia i efektywnego zarządzania danymi medycznymi.

  • Dane (Data) – wszelkie informacje, które mogą być przetwarzane lub analizowane w celu uzyskania wglądu. Dane mogą mieć postać liczb i statystyk, tekstu, symboli lub multimediów, takich jak obrazy, filmy, dźwięki i mapy.

Przykład: W kontekście opieki zdrowotnej dane mogą obejmować rejestry pacjentów, badania kliniczne i wyniki monitorowania stanu zdrowia w czasie rzeczywistym.

  • Uczenie maszynowe (Machine Learning – ML) – podzbiór sztucznej inteligencji, który umożliwia maszynom automatyczne uczenie się i doskonalenie na podstawie doświadczenia bez wyraźnego programowania. Wykorzystując ustalone procesy do analizy dużych ilości danych, systemy ML mogą identyfikować wzorce, pomagać w podejmowaniu decyzji i poprawiać swoją wydajność przy niewielkiej lub zerowej interwencji człowieka. 

Przykład: W opiece zdrowotnej aplikacje ML obejmują przewidywanie postępu choroby, analizę obrazów medycznych i optymalizację klinicznych przepływów pracy.

  • Model – prosta reprezentacja aspektu świata rzeczywistego. Jest to program, który został przeszkolony na zestawie danych w celu rozpoznawania pewnych wzorców lub podejmowania pewnych decyzji bez dalszej interwencji człowieka.
  • Prompt (inżynieria) – prompt to pytanie, polecenie lub stwierdzenie wprowadzone do modelu sztucznej inteligencji w celu zainicjowania odpowiedzi lub działania, ułatwiające interakcję między człowiekiem a sztuczną inteligencją w celu wygenerowania zamierzonego wyniku.

Interpretacja modeli

  • Dokładność (Accuracy) – dokładność to metryka w uczeniu maszynowym, która mierzy, jak często model poprawnie przewiduje wynik. Jest to ułamek przewidywań, które model zrealizował prawidłowo, wskazujący na ogólną trafność jego prognoz. Dokładność pokazuje, jak często model klasyfikacyjny uczenia maszynowego daje poprawne odpowiedzi w ujęciu całościowym. Metryka ta jest szczególnie użyteczna, gdy klasy są zrównoważone (tj. liczba instancji w każdej klasie jest mniej więcej taka sama). Jednak może być myląca w przypadku niezrównoważonych klas. Idealnie, dokładność powinna być jak najbliższa 100%, jednak często akceptowane są wartości w zakresie 70-90%. Ważne jest, aby pamiętać, że dokładność na poziomie 50% oznacza, że połowa przypadków jest klasyfikowana jako pozytywne, a połowa jako negatywne, co w praktyce odpowiada losowej klasyfikacji.
  • Stronniczość (Bias) – stronniczość występuje, gdy system sztucznej inteligencji generuje wyniki, które są systematycznie uprzedzone z powodu błędnych założeń w procesie uczenia maszynowego. To uprzedzenie może odzwierciedlać i utrwalać ludzkie uprzedzenia i nierówności społeczne obecne w początkowych danych szkoleniowych, samym algorytmie lub generowanych przez niego prognozach.

Przykład: Pulsoksymetry są mniej dokładne dla osób o ciemniejszym odcieniu skóry, co oznacza, że sztuczna inteligencja zastosowana do tego urządzenia może niedoszacować raka skóry u osób o ciemniejszej skórze z powodu mniejszej ilości danych.

  • Wyjaśnialność (Explainability) – miara tego, jak zrozumiałe lub wytłumaczalne dla ludzi są decyzje podejmowane przez system sztucznej inteligencji.

Przykład: System sztucznej inteligencji może przewidzieć, którzy pacjenci najbardziej potrzebują operacji, ale powinien być w stanie wyjaśnić, dlaczego nadał priorytet pacjentom w określony sposób.

  • Wytłumaczalna sztuczna inteligencja (XAI) – gdzie ludzie mogą zrozumieć, w jaki sposób uzyskano wyniki modelu sztucznej inteligencji.
  • Dryf modelu (Model drift) – dryf modelu to pogorszenie się dokładności predykcyjnej modelu uczenia maszynowego w czasie, spowodowane zmianami w rzeczywistych warunkach lub nowymi danymi wejściowymi, które różnią się od danych użytych podczas trenowania modelu.

Przykład: Gdy zostaje uruchomiona nowa trasa autobusowa do szpitala, co sprawia, że model przewidujący absencje pacjentów staje się mniej dokładny, ponieważ wzorce frekwencji pacjentów zmieniają się w porównaniu do tych, które występowały w momencie trenowania modelu (przed wprowadzeniem nowej trasy).

  • Precyzja (Precision) – precyzja to odsetek pozytywnych przewidywań modelu, które okazały się poprawne. Na przykład, jeśli model przewiduje 100 przypadków jako pozytywne, a 70 z nich faktycznie jest pozytywnych, precyzja wynosi 70%. Precyzja pokazuje, jak często model uczenia maszynowego trafnie przewiduje docelową klasę.
  • Skalowalność (Scalability) – skalowalność w kontekście uczenia maszynowego odnosi się do zdolności systemu do obsługi rosnących ilości danych i zasobów obliczeniowych bez pogorszenia wydajności lub precyzji. Oznacza to, że system potrafi przetwarzać duże zbiory danych, wciąż dostarczając dokładne wyniki w rozsądnym czasie.
  • Czułość (Sensitivity, recall) – czułość to odsetek faktycznych przypadków pozytywnej klasy, które model poprawnie zidentyfikował. Na przykład, jeśli w zbiorze danych jest 100 pozytywnych przypadków, a model poprawnie rozpoznaje 60 z nich, czułość wynosi 60%. Czułość mierzy zdolność modelu uczenia maszynowego do identyfikacji wszystkich obiektów należących do docelowej klasy.
  • Swoistość (Specificity) – swoistość wskazuje na zdolność modelu do poprawnego przewidywania prawdziwych negatywnych przypadków dla każdej kategorii. Innymi słowy, swoistość ocenia, jak dobrze model poprawnie identyfikuje przypadki, które nie należą do docelowej klasy.
  • Szkolenie modelu – szkolenie modelu w uczeniu maszynowym to proces, w którym algorytm uczy się dokonywać prognoz lub podejmować decyzje na podstawie danych.

Przykład: W opiece zdrowotnej często polega to na szkoleniu modelu z wykorzystaniem danych klinicznych, aby poprawić dokładność diagnoz i skuteczność leczenia.

Typy danych

  • Big data – big data to niezwykle duże i szybko rosnące zbiory różnorodnych typów danych, obejmujące zarówno dane strukturalne, jak i niestrukturalne, które są na tyle skomplikowane, że tradycyjne oprogramowanie do przetwarzania danych nie jest w stanie ich obsłużyć.

Przykład: W opiece zdrowotnej big data może obejmować przetwarzanie wielu źródeł danych strukturalnych i niestrukturalnych, takich jak dane genetyczne, historia medyczna i czynniki związane ze stylem życia, aby wspierać medycynę spersonalizowaną.

  • Dane strukturalne – dane strukturalne to dane zorganizowane i sformatowane w określony sposób, co sprawia, że są łatwe do odczytania i zrozumienia zarówno dla ludzi, jak i maszyn. Umożliwia to natychmiastowe rozpoznanie typu danych, z którymi mamy do czynienia.

Przykład: Elektroniczna karta zdrowia pacjenta (EHR), która zawiera pola na imię, wiek, ciśnienie krwi i kody diagnozy, jest przykładem danych strukturalnych.

    • Dane syntetyczne – dane syntetyczne to dane generowane sztucznie przez algorytmy komputerowe lub symulacje, zaprojektowane tak, aby naśladować wzorce i cechy danych z rzeczywistego świata. Często są one stosowane jako alternatywa dla rzeczywistych danych.
    • Dane testowe – dane testowe to ostateczna kontrola na niewidocznych zbiorach danych, mająca na celu potwierdzenie, że algorytm uczenia maszynowego został skutecznie przeszkolony oraz weryfikację, czy model potrafi dokonywać dokładnych prognoz.
    • Dane treningowe – dane treningowe to dane używane do szkolenia modeli uczenia maszynowego. Starannie wyselekcjonowane zbiory danych treningowych są podawane algorytmom uczenia maszynowego, aby nauczyć je, jak dokonywać prognoz lub realizować określone zadania.
  • Dane niestrukturalne – dane niestrukturalne to dane, które nie mają z góry określonej struktury ani organizacji. W przeciwieństwie do danych strukturalnych, które są uporządkowane w rzędy i kolumny w bazie danych, dane niestrukturalne stanowią nieuporządkowany i obszerny zbiór informacji.

Przykład: W opiece zdrowotnej dane niestrukturalne często obejmują notatki medyczne, nagrania audio interakcji z pacjentami oraz obrazy z różnych procedur diagnostycznych.

  • Dane walidacyjne – dane walidacyjne to dane, które nie są uwzględnione w zbiorze treningowym modelu, co pozwala naukowcom zajmującym się danymi ocenić, jak dobrze (przy użyciu metryk takich jak dokładność, precyzja, czułość i swoistość) model dokonuje prognoz na podstawie nowych danych, których model nie widział podczas szkolenia.

Typy uczenia maszynowego

  • (Sztuczna) sieć neuronowa – sieć neuronowa to rodzaj programu uczenia maszynowego, który podejmuje decyzje w sposób podobny do ludzkiego mózgu. Przetwarza dane za pomocą połączonych jednostek zwanych neuronami, które współpracują, aby identyfikować wzorce, oceniać opcje, wyciągać wnioski oraz uczyć się i poprawiać z czasem. Ta metoda, inspirowana działaniem biologicznych neuronów, uczy komputery radzenia sobie ze złożonymi problemami, naśladując warstwową strukturę mózgu.
  • Uczenie ze wzmocnieniem (Reinforcement learning) – uczenie ze wzmocnieniem to podzbiór uczenia maszynowego, który umożliwia systemowi opartemu na sztucznej inteligencji uczenie się poprzez próbę i błąd, korzystając z informacji zwrotnej z podejmowanych działań.

Przykład: Jest to szczególnie przydatne w medycynie spersonalizowanej, gdzie systemy uczą się optymalizować leczenie na podstawie indywidualnych reakcji pacjentów.

  • Uczenie półnadzorowane (Semi-supervised learning) – uczenie półnadzorowane to rodzaj uczenia maszynowego, który znajduje się pomiędzy uczeniem nadzorowanym a nienadzorowanym. Jest to metoda, która wykorzystuje małą ilość danych z etykietami i dużą ilość danych bez etykiet do szkolenia modelu.

Przykład: To podejście jest korzystne w przypadku danych pacjentów, gdzie uzyskanie w pełni oznaczonych zbiorów danych może być kosztowne lub niepraktyczne.

  • Uczenie nadzorowane (Supervised learning) – uczenie nadzorowane to kategoria uczenia maszynowego, w której do szkolenia algorytmów wykorzystuje się zbiory danych z etykietami (każde wejście ma znany wynik), aby przewidywać wyniki lub rozpoznawać wzorce. Analizując te zbiory danych, komputer uczy się przewidywać wynik na podstawie nowych danych wejściowych. Jest to jak nauczanie komputera przez pokazywanie mu wielu przykładów i pozwalanie mu zrozumieć, jak robić rzeczy poprawnie.

Przykład: W opiece zdrowotnej ta metoda jest szeroko stosowana w diagnostyce, na przykład do identyfikacji chorób na podstawie danych z obrazowania medycznego.

  • Uczenie nienadzorowane (Unsupervised learning) – uczenie nienadzorowane to rodzaj uczenia maszynowego, które nie wymaga danych z etykietami ani ludzkiego nadzoru. Działa na danych bez etykiet, aby odkrywać wzorce i spostrzeżenia w zbiorze danych. Algorytmy badają zbiór danych bez wyraźnych instrukcji, aby niezależnie znaleźć nieznane relacje lub spostrzeżenia. To jak pozwolenie komputerowi na eksplorację zbioru danych, przy jednoczesnym umożliwieniu mu samodzielnego odkrywania wzorców i struktur.

Typy modeli

  • Model głębokiego uczenia (Deep learning model) – model głębokiego uczenia to forma uczenia maszynowego, która wykorzystuje sztuczne sieci neuronowe, inspirowane ludzkim mózgiem, do nauki z ogromnych ilości danych (w tym danych z etykietami i bez etykiet, danych strukturalnych i niestrukturalnych). Te sieci umożliwiają systemom cyfrowym naukę i podejmowanie decyzji automatycznie i niezależnie, bez ludzkiej interwencji.

Przykład: Modele te są coraz częściej stosowane w obszarach takich jak patologia, radiologia i genetyka.

    • Model fundamentowy (Foundation model) – model fundamentowy to model uczenia maszynowego, który został przeszkolony na ogromnej ilości danych, dzięki czemu można go łatwo dostosować do szerokiego zakresu zastosowań. Typowym przykładem modelu fundamentowego są duże modele językowe, które zasilają chatboty, takie jak ChatGPT.
    • Człowiek w pętli (Human-in-the-loop) – człowiek w pętli to system, który składa się z komponentu ludzkiego i komponentu AI, w którym człowiek może w znaczący sposób interweniować, na przykład poprzez szkolenie, dostrajanie lub testowanie algorytmu systemu, aby uzyskać bardziej użyteczne wyniki. To sposób łączenia inteligencji ludzkiej i maszynowej, który pomaga zrekompensować niedociągnięcia obu.
  • Duży model językowy (Large language model, LLM) – duży model językowy to model uczenia maszynowego zdolny do wykonywania różnych zadań związanych z przetwarzaniem języka naturalnego. Do tych zadań należy generowanie i klasyfikowanie tekstów oraz obrazów, odpowiadanie na pytania w sposób konwersacyjny, tłumaczenie między językami, przewidywanie i podsumowywanie treści. Wykorzystuje algorytmy głębokiego uczenia oraz ogromne zbiory danych, aby osiągnąć te możliwości.

Przykład: W opiece zdrowotnej modele te wspierają podejmowanie decyzji klinicznych oraz interakcję z pacjentami.

  • Model multimodalny (Multimodal model) – model multimodalny to model uczenia maszynowego, który przetwarza i łączy różne typy danych, takie jak obrazy, filmy i tekst, aby dokonywać bardziej precyzyjnych ocen, wyciągać wnikliwe wnioski lub formułować dokładne prognozy dotyczące problemów ze świata rzeczywistego.

Przykład: Modele multimodalne mogą uwzględniać dane z elektronicznej karty zdrowia, obraz wykonany podczas badania rentgenowskiego oraz pisemny opis radiologa dotyczący tego badania, aby wyciągać wnioski na temat diagnoz.

Zastosowania sztucznej inteligencji (AI)

  • Halucynacja AI (AI hallucination) – halucynacja AI występuje, gdy sztuczna inteligencja, taka jak duży model językowy, generuje fałszywe lub wprowadzające w błąd informacje, które wydają się faktami, ale w rzeczywistości są nieprawdziwe lub bezsensowne. Może to być spowodowane identyfikowaniem wzorców, które nie istnieją w rzeczywistości.

Przykład: Na przykład, model AI sugerujący niewłaściwe leki dla pacjenta na podstawie halucynowanych danych.

  • Ambient AI – ambient AI to rodzaj sztucznej inteligencji, która integruje się z otoczeniem, aby poprawić interakcję z ludźmi, nie będąc przy tym zauważalną. Działa w tle, wykorzystując czujniki do rozumienia i przewidywania zachowań ludzkich. Ciągle zbiera dane z tych urządzeń, aby podejmować decyzje w czasie rzeczywistym.

Przykład: W opiece zdrowotnej ambient AI może być używane do monitorowania stanu pacjentów w czasie rzeczywistym, optymalizacji operacji szpitalnych oraz dostarczania spersonalizowanych usług zdrowotnych, minimalizując jednocześnie potrzebę bezpośrednich poleceń lub interwencji ze strony ludzi. Zwiększa jakość opieki nad pacjentami, przewidując ich potrzeby i interweniując proaktywnie, co poprawia wyniki zdrowotne oraz efektywność operacyjną.

  • Wizja komputerowa (Computer vision) – wizja komputerowa to dziedzina sztucznej inteligencji, która uczy komputery interpretować i rozumieć świat wizualny. Maszyny mogą dokładnie identyfikować i lokalizować obiekty, a następnie reagować na to, co „widzą”, wykorzystując obrazy cyfrowe z kamer, filmy i modele głębokiego uczenia.

Przykład: Wizja komputerowa jest wykorzystywana w narzędziach, które automatycznie przeprowadzają przesiewowe badania w kierunku retinopatii cukrzycowej na podstawie obrazów siatkówki.

  • System wsparcia decyzji (Decision support system) – system wsparcia decyzji to system oparty na komputerze, który pomaga użytkownikom podejmować decyzje, analizując dużą ilość danych, dostarczając wgląd i sugerując możliwe kierunki działania. Łączy dane, modele analityczne i intuicyjne oprogramowanie, aby wspierać rozwiązywanie problemów i podejmowanie decyzji.

Przykład: W opiece zdrowotnej może to obejmować algorytm uczenia maszynowego, który analizuje obrazy radiologiczne, aby dostarczyć diagnozę wspierającą decyzje lekarza.

  • Cyfrowy bliźniak (Digital twin) – cyfrowy bliźniak to model komputerowy, który symuluje obiekt w rzeczywistym świecie, taki jak system biologiczny. Analiza wyników modelu może pomóc badaczom zrozumieć, jak fizyczny obiekt będzie się zachowywał, co wspiera ich w poprawie projektu i/lub funkcjonowania w rzeczywistości.
  • Generatywna AI (Generative AI, Gen AI) – generatywna AI to algorytmy zdolne do tworzenia nowego, oryginalnego contentu, w tym tekstów, obrazów, dźwięków, symulacji i kodu oprogramowania, w odpowiedzi na zapytania lub prośby użytkowników.

Przykład: W dziedzinie medycyny generatywna AI jest wykorzystywana do symulacji danych pacjentów, opracowywania wirtualnych modeli do szkolenia oraz generowania syntetycznych danych biologicznych do badań.

  • Przetwarzanie języka naturalnego (Natural Language Processing, NLP) – przetwarzanie języka naturalnego to dziedzina sztucznej inteligencji, która umożliwia komputerom rozumienie, interpretowanie i generowanie ludzkiego języka. NLP wykorzystuje techniki analizy danych, uczenia maszynowego i modeli statystycznych do analizy tekstu i mowy, aby zidentyfikować wzorce oraz umożliwić interakcję między ludźmi a maszynami.

Przykład: W aplikacjach medycznych przetwarzanie języka naturalnego może być używane do analizy notatek klinicznych, zrozumienia potrzeb pacjentów oraz automatyzacji dokumentacji medycznej.

  • Analiza predykcyjna / modelowanie predykcyjne (Predictive analytics / predictive modelling) – analiza predykcyjna to proces wykorzystujący dane do prognozowania przyszłych wyników. Proces ten obejmuje analizę danych, uczenie maszynowe, sztuczną inteligencję oraz modele statystyczne w celu znalezienia wzorców, które mogą przewidywać przyszłe zachowania.