Kontakt

Inteligentny system przetwarzania mowy w transkrypcji medycznej

Netrix Link Sp. z o.o. realizuje projekt pn. „Inteligentny system przetwarzania mowy w transkrypcji medycznej”. Projekt jest współfinansowany ze środków Unii Europejskiej w ramach Działania Ścieżki Smart, Priorytetu Wsparcie dla Przedsiębiorstw, Programu Fundusze Europejskie dla Nowoczesnej Gospodarki.

Celem projektu jest opracowanie funkcjonalnego systemu wspierającego pacjentów i lekarzy w prowadzeniu elektronicznej dokumentacji medycznej podczas wizyty lekarskiej z wykorzystaniem zaawansowanych algorytmów NLP/NLU w języku polskim. Osiągnięcie celu wymaga opracowania narzędzi pozwalających na akwizycję i przetwarzanie mowy (frazy wypowiadane przez lekarza i pacjenta) oraz wydobywanie z tekstu istotnych informacji, które byłyby klasyfikowane semantycznie i wprowadzane do wcześniej zbudowanych formularzy i baz danych. Formularze powinny być elastyczne i dostosowywane do specjalizacji lekarza, który z nich korzysta. Na podstawie zebranej wiedzy i zdefiniowanych formularzy system będzie w stanie automatycznie generować recepty, zwolnienia, skierowania itp. Stworzone aplikacje mobilne oraz webowe pozwolą przeprowadzić pacjenta przez cały proces wizyty lekarskiej, pozwolą na przesyłanie dokumentów stanowiących uzupełnienie do dokumentacji wizyty, zapisać jej treść oraz umożliwią przeglądanie informacji dotyczących wizyty na stronie internetowej profilu pacjenta.

Grupą docelową i ostatecznymi odbiorcami, do których skierowany jest projekt są przede wszystkim placówki medyczne i pacjentów w kraju. Jednakże, segment rynku, który można realnie obsłużyć (SAM), uwzględniając placówki, które są gotowe do cyfryzacji i inwestycji w nowe technologie.

Prace w ramach projektu będą realizowane w ramach badań przemysłowych, eksperymentalnych prac rozwojowych:

Zadanie 1 – badanie przemysłowe – Opracowanie metod pozyskiwania zbioru danych oraz ich anonimizacji) – Opracowanie metod pozyskiwania zbioru danych oraz ich anonimizacji stanowi fundamentalny krok w procesie analizy danych medycznych. Zapewnienie zgodności z przepisami ochrony danych osobowych oraz skuteczne zachowanie poufności danych pacjentów są kluczowe dla zapewnienia legalności, integralności i skuteczności procesu analizy danych medycznych. Kroki, które zostaną podjęte w tym celu obejmują: ustalenie i przestrzeganie zgodności z przepisami ochrony danych osobowych, takimi jak RODO w Unii Europejskiej.

zadanie 2 – badania przemysłowe – Opracowanie urządzenia brzegowego i modułu rozpoznawania mowy Opracowanie urządzenia brzegowego (ang. edge device) oraz modułu rozpoznawania mowy to kompleksowe zadanie, które można podzielić na kilka kluczowych etapów. Pierwszym z nich jest analiza wymagań i specyfikacji, która obejmuje działanie polegające na zrozumieniu kontekstu użycia urządzenia i wymagań funkcjonalnych. Kolejnym etapem będzie określenie wymagań sprzętowych i oprogramowania obejmujące ustalenie wymagań dotyczących rozpoznawania mowy, w tym języków, dialektów, akcentów oraz tolerancji na szumy i zakłócenia. Następnie zostanie przeprowadzony etap polegający na projektowaniu rozwiązania sprzętowego. Etap ten polega na wyborze komponentów sprzętowych, w tym mikrokontrolerów, czujników, układów audio i interfejsów sieciowych.

Zadanie 3 – badania przemysłowe – Opracowanie algorytmów NLP – W ramach zadania zostaną opracowane zaawansowane algorytmy z zakresu przetwarzania języka naturalnego (NLP), rozumienia języka naturalnego (NLU) oraz klasyfikacji tekstu w języku polskim w domenie wywiadów medycznych, mające na celu automatyzację analizy danych tekstowych oraz uzupełniania formularzy medycznych. Kluczowymi operacjami będą tokenizacja, czyli podział tekstu na mniejsze jednostki (np. słowa, zdania), oraz tagowanie tekstu, czyli przypisywanie do tych jednostek odpowiednich kategorii gramatycznych czy znaczeniowych. Dodatkowo, algorytmy zostaną wykorzystane do rozpoznawania encji, czyli identyfikacji konkretnych obiektów, miejsc czy zdarzeń w tekście oraz do ekstrakcji informacji, polegającej na wydobyciu z tekstu istotnych danych, takich jak daty, liczby czy nazwy. Kluczowym celem zadania jest także opracowanie mechanizmu klasyfikacji intencji, który wykorzystuje techniki uczenia maszynowego i przetwarzania języka naturalnego do automatycznego identyfikowania intencji użytkownika na podstawie wprowadzanego tekstu.

Zadanie 4 – badanie przemysłowe – Udoskonalenie baz danych i opracowanie dynamicznych scenariuszy i formularzy – W tym zadaniu uwaga zostanie skupiona na rozbudowie i usprawnieniu funkcjonalności opracowanych w poprzedniej fazie projektu, dążąc do automatyzacji klasyfikacji tekstu wywiadów medycznych oraz formularzy. W ramach zadania zostaną podjęte następujące podzadania: udoskonalenie baz danych – poprawa jakości i kompletności danych dotyczących wywiadów medycznych oraz formularzy, rozbudowa słowników medycznych – polega na poszerzeniu słowników terminów medycznych w języku polskim, testowanie modeli i algorytmów – uwaga zostanie skupiona na sprawdzeniu, poprawności działania oraz rozbudowie algorytmów w kontekście nowej wiedzy pozyskanej z danych, opracowanie dynamicznych scenariuszy wywiadów medycznych – koncentruje się na stworzeniu elastycznych scenariuszy wywiadów, które mogą być modyfikowane w czasie rzeczywistym, opracowanie dynamicznych formularzy wywiadów medycznych – skupia się na tworzeniu spersonalizowanych formularzy, dostosowanych do indywidualnych cech i historii zdrowia pacjenta.

Zadanie 5 – prace rozwojowe – Opracowanie architektury, interfejsów API oraz prototypu systemu. Głównym celem zadania jest integracja elementów opracowanego systemu. Prace będą skoncentrowane na rozszerzeniu, ujednoliceniu i stworzeniu postaci końcowej bazy wiedzy dotyczącej wizyt lekarskich oraz implementacji i optymalizacji opracowanych algorytmów, stworzeniu końcowego silnika analitycznego, aplikacji komunikacyjnej oraz testowaniu działania poszczególnych elementów systemu i systemu jako całości. Podczas prac zostanie przygotowana architektura systemu której główną część będą stanowić aplikacje pacjenta oraz lekarza wraz z interfejsem sprzętowym służącym do rejestracji i przetwarzania mowy podczas wizyt stacjonarnych oraz silnik analityczny przygotowany na postawie algorytmów utworzonych w poprzednich fazach projektu.

W wyniku realizacji projektu stworzony zostanie gotowy funkcjonalny system wspierający pacjentów i lekarzy w prowadzeniu elektronicznej dokumentacji medycznej podczas wizyty lekarskiej z wykorzystaniem zaawansowanych algorytmów NLP/NLU w języku polskim.

Wartość projektu: 8 206 199,20 zł
Wysokość wkładu z Funduszy Europejskich: 5 769 993,75 zł
Okres Realizacji: październik 2024 – wrzesień 2027

#FunduszeUE
#FunduszeEuropejskie