SAS Text Analytics to uniwersalna platforma zaspokajająca zapotrzebowania informacyjne w organizacji do wyciągania i zarządzania informacją dostępną w najróżniejszego rodzaju dokumentach tekstowych. Praca składa się z czterech części, w których można znaleźć następujące zagadnienia: potrzebną interdyscyplinarną wiedzę, klasyfikację stosowanych metod na tle innych dziedzin zajmujących się przetwarzaniem danych, architekturę oprogramowania SAS Text Analytics, sposób reprezentacji danych zawartej w dokumencie tekstowym, metodę analizy semantycznej rozmiarów ukrytych, dobór funkcji wagującej i redukcję wymiarowości macierzy częstości, algorytmy grupowania dokumentów tekstowych: probabilistyczne i hierarchiczne, sposoby zarządzania informacją w organizacji, klasyfikację dokumentów, analizę sentymentu, bezpośrednie porównywanie treści dokumentów za pomocą miar odległości kosinusowej i metryki Jaccarda, zasady wyciągania jednostek specjalnych, sposoby wizualizacji danych tekstowych, polsko-angielski słownik pojęć z dziedziny eksploracji danych tekstowych, kształt zagadnień dotyczących programowania w środowisku SAS: podstawy języka 4GL języka makr, wykaz literatury tematycznej.
Możliwości omówionych narzędzi i zastosowanych algorytmów zostały zilustrowane na przykładach zbiorów danych z zróżnicowanych dziedzin: zbioru krótkich wypowiedzi dotyczących sportu, pogody i zwierząt, zbioru opisów radiologicznych badań diagnostycznych jamy brzusznej oraz zbioru opinii użytkowników na temat telefonów z forów użytkowników Dominik Spinczyk Doktor nauk technicznych w dyscyplinie Biocybernetyka i Inżynieria Biomedyczna; habilitacja w nowym trybie na podstawie zbioru publikacji na etapie recenzji zewnętrznych w Centralnej Komisji; Politechnika Śląska; Wydział Inżynierii Biomedycznej; obecnie do końca listopada PostDoc position: Centrum Onkologii Lyon, Francja.
Mariusz Dzieciątko Dr inż. Mariusz Dzieciątko, doktor nauk technologicznych, Business Solution Manager w SAS Poland Technology and Big Data Competency Center i wykładowca w Szkole Głównej Handlowej w Warszawie w Instytucie Informatyki i Gospodarki Cyfrowej.
Powyższy opis pochodzi od wydawcy.