Máte zájem přidat témata dizertací do této kategorie? Napište, prosím, na info@martinvita.eu.
Přehled pracovišť:
- Matematicko-fyzikální fakulta UK – Informatická sekce
- Fakulta informatiky a statistiky VŠE – Katedra informačního a znalostního inženýrství
- Ústav pro výzkum a aplikace fuzzy modelování OU
- Ústav informatiky AV ČR
- Fakulta elektrotechniky a komunikačních technologií VUT
Matematicko-fyzikální fakulta UK – Informatická sekce
Aspect-Based Sentiment Analysis
Supervisor: RNDr. Ondřej Bojar, Ph.D. (Ústav formální a aplikované lingvistiky)
Topic description: Under sentiment analysis (SA), we understand the task of automatic extraction of an opinion from a natural text. The prototypical applications of SA include summarizing users’ views from discussions or market trends prediction based on consumers’ data.
The aim of the thesis is to experiment with methods refining SA to the level of ‘aspects’. Instead of reporting the general sentiment of a given text (e.g. whether a review overall does or does not recommend a product), the thesis will be automatically extracting the set of mentioned aspects of the product together with the expressed valuations (e.g. that the display of a cell phone is outstanding but
the battery is poor).
The primary language of experiments will be Czech, taking advantage of both existing SA techniques designed for English as well as the range of NLP tools available for Czech. The thesis will review existing SA methods and adapt them as needed for Czech. Whenever possible, the proposed methods should be language independent, but we expect that the best performance can be reached only when employing language-specific knowledge. This also holds for domain dependency.
An empirical evaluation using standard quality measures is an inherent part of the thesis. We can benefit from extensive knowledge developed at ÚFAL about SA related tasks and use and further develop already existing data such as Czech Subjectivity Lexicon or sentiment extension of PDT data.
Software Engineering of Smart Cyber Physical and IoT Systems
Supervisor: doc. RNDr. Tomáš Bureš, Ph.D. (Department of Distributed and Dependable Systems)
Cyber-Physical Systems (CPS) and Internet of Things (IoT) are engineered systems that are built from, and depend upon, the seamless integration of
computational and physical components. With the proliferation of smart embedded and mobile devices, CPS and IoT systems are becoming a large-scale pervasive fabric, which combines various data sources to control real-world ecosystems (e.g., intelligent traffic control, smart manufacturing). Modern CPS and IoT systems have to deal effectively with environment dynamicity, control their emergent behavior, be scalable and tolerant to threats, hence these systems have to be smart. This features a number of specifics that render traditional software engineering approaches to not directly applicable, and calls for innovative approaches that jointly reflect and address the specifics of such systems.
This work should focus on research in architectures of smart CPS and IoT systems. This includes research in self-adaptivity, coping with uncertainty
using statistical and learning methods, integration with cloud and edge-cloud systems, addressing dependability via testing and software analysis and verification, etc. This topic is open for multiple candidates. The exact thesis topic will be tailored to fit applicant’s skill and interests and to reflect the current applied research projects held by the department.
Fakulta informatiky a statistiky VŠE – Katedra informačního a znalostního inženýrství
Lexikální rozhraní ontologických schémat a interakce uživatelů s ním
Školitel: doc. Ing. Vojtěch Svátek, Dr.
Anotace: Ontologická schémata se ve stále větší míře používají jako nástroj interoperability nezávisle vzniklých aplikací, propojitelných datasetů a znalostních grafů (ve veřejné správě, podnikání, zdravotnictví, výzkumu, aj.). Zatímco formálně-logické vlastnosti ontologií, zejména v jazyce OWL založeném na deskripční logice, byly v posledních 20 letech předmětem intenzivního výzkumu, otázky reprezentace a zpracování lexikálních prvků ontologií (identifikátorů, popisků, ev. i delších komentářů) byly dosud řešeny jen okrajově v několika málo projektech. Navrhovaný projekt bude v počáteční fázi mapovat reálné scénáře činnosti různých typů softwarových aplikací, ve kterých uživatel (ať už koncový, nebo programátor, resp. databázový/znalostní inženýr) interaguje s ontologiemi prostřednictvím jejich lexikálních prvků. Z tohoto namapování budou odvozeny požadavky na vhodné způsoby reprezentace lexikální informace v ontologiích. Na rozdíl od některých dřívějších projektů, usilujících o vytváření dodatečné lexikální vrstvy ontologií, se bude nový návrh snažit postihnout potřeby aplikačních scénářů čistě na úrovni jmenných konvencí interních lexikálních položek, tj. bez zkomplikování logické struktury ontologií jako takových. Vedle toho budou navrženy postupy, jak lexikální prvky pro aplikační scénáře transformovat (se zahrnutím např. změn slovního druhu nebo inteligentního slučování lexikální informace z více ontologických entit); pro tuto část práce je předností alespoň základní obeznámenost s aparátem komputační lingvistiky.
Dolování z propojených veřejnosprávních dat
Školitel: doc. Ing. Vojtěch Svátek, Dr.
Anotace: Propojená veřejnosprávní data (government linked data) představují jednu z nejrozsáhlejších aplikací technologie propojených dat. Veřejná správa na mnoha úrovních publikuje data jak o své vlastní činnosti, tak o dalších sledovaných agendách (školství, doprava, obchod, aj.) Propojování objektů z nezávisle vzniklých datasetů, ať už přes jednoznačné identifikátory, nebo i heuristickým způsobem, umožňuje jednotlivé datasety obohacovat o další příznaky a potenciálně tak odvozovat obecné vztahy a zákonitosti, které by z izolovaných datasetů nemohly být odhaleny a jsou být zajímavé jak pro veřejnou správu samotnou, tak i pro občanské iniciativy, které ji sledují “zdola”. Výzvou ovšem je nepravidelná grafová struktura dat, pro kterou jsou obtížně využitelné tradiční algoritmy pracující s jednou nebo několika málo relačními tabulkami. Pro učení nad propojenými daty ve formátu “sémantického webu”, RDF, byly v poslední době adaptovány či vyvinuty zcela nově učící algoritmy. Jedním z nich je např. algoritmus AMIE+, jehož vylepšení a optimalizace je předmětem disertační práce již řešené na katedře informačního a znalostního inženýrství (KIZI) VŠE. Navrhovaný disertační projekt by navazoval jak na tuto práci (s cílem aplikovat dosažené výsledky na zvolenou množinu propojených veřejnosprávních datasetů, včetně identifikace doménových znalostí, které by bylo možné využít pro zefektivnění a zpřesnění analýzy), tak i na již obhájenou disertaci J. Mynarze (http://mynarz.net/dissertation/), v jejímž rámci byla ověřena řada technik předzpracování veřejnosprávních dat (zejména o veřejných zakázkách) pro analytické úlohy. Vzhledem k zaměření práce je nutnou prerekvizitou alespoň základní obeznámenost (na úrovni obvyklých magisterských kurzů) s problematikou data miningu a/nebo propojených dat (RDF).
Ústav pro výzkum a aplikace fuzzy modelování OU
Možnosti navigace dronu v budovách
Školitel: prof. Irina Perfiljeva, CSc.
Konzultant: Mgr. Petr Hurtík, Ph.D.
Anotace: Práce se zabývá automatizovanou navigací dronu, tedy zařízení schopného samostatného pohybu (letu), vybaveného kamerou v uzavřených prostorech, kde se předpokládá absence GPS signálu a tedy nutnost vizuální navigace. Tato navigace, respektive pohyb dronu předpokládá využití v následujících úlohách: vytváření modelů budov; průzkum nebezpečných oblastí; sledování pohyblivých objektů v budově. Pro řešení úloh se předpokládá zvládnutí následujících problémů: realizace programové komunikace mezi dronem a ovládajícím zařízením; nalezení a klasifikace objektů v obrazu; sledování objektů v jednotlivých snímcích videa; vytváření 3D modelů; realizace kontroléru pro pohyb dronu; rozpoznání gest. Jako výstup práce se předpokládá, že autor přispěje k problematice teoreticky (v podobě publikovaných článků) i prakticky (v podobě implementace navržených algoritmů pro konkrétní model dronu).
Rekonstrukce poškozených obrazů využítím vzorů a neuronových sítí
Školitel: prof. Irina Perfiljeva, CSc.
Konzultant: Mgr. Pavel Vlašánek, Ph.D.
Anotace: Práce by měla za úkol studovat možnosti rekonstrukce velkých oblastí v obrazu, kde by jednotlivé části „k dosazení“ (záplaty) nemusely být v obraze vůbec obsaženy. Záplaty se budou čerpat z připravené databáze pomocí neuronové sítě naučené právě na tuto úlohu a následně post processingem upravovat a zasazovat na správná místa.
Ústav informatiky AV ČR
Evoluční optimalizace a aktivní učení (školitel: doc. Ing. RNDr. Martin Holeňa, CSc.)
Anotace: Evoluční algoritmy jsou v posledních 20 letech jednou z nejúspěšnějších metod pro řešení netradičních optimalizačních problémů, jako např. hledání nejvhodnějších dokumentů obsahujících požadované informace, objevování nejzajímvějších informací v dostupných datech či další typy optimalizačních úloh, při nichž lze hodnoty cílové funkce získat pouze empiricky. Protože evoluční algoritmy pracují pouze s funkčními hodnotami optimalizované funkce, blíží s k jejímu optimu podstatně pomaleji než optimalizační metody pro hladké funkce, které využívají rovněž informace o gradientu optimalizované funkce, případně o jejích druhých derivacích. Tato vlastnost evolučních algoritmů je zvláště nepříjemná ve spojení se skutečností, že empirické získání hodnoty optimalizované funkce bývá obvykle značně nákladné i časově náročné. Evoluční algoritmy však lze podstatně urychlit tím, že při vyhodnocování funkční hodnoty optimalizované funkce používají empirickou optimalizovanou funkci jen občas, zatímco většinou vyhodnocují pouze její dostatečně přesný regresní model. Právě přesnost modelu určuje, jak úspěšnou náhražkou původní empirické funkce bude. Proto se po získání každé nové generace bodů, v nichž byla empirická funkce vyhodnocena, model zpřesňuje opakovaným učením zahrnujícím tyto body. Lze však jít ještě dále a již při volbě bodů pro empirické vyhodnocení brát kromě hodnoty empirické funkce také v úvahu, jak při opakovaném učení modelu přispějí k jeho zpřesnění. Takový přístup se označuje jako aktivní učení. Používání aktivního učení k urychlení evolučních algoritmů je však teprve v úplných začátcích a měla by ho podpořit i navržená práce. (http://www2.cs.cas.cz/~martin/)
Urychlení evoluční optimalizace pomocí gaussovských procesů
Školitel: doc. Ing. RNDr. Martin Holeňa, CSc.
Anotace: Evoluční algoritmy jsou v posledních 20 letech jednou z nejúspěšnějších metod pro řešení netradičních optimalizačních problémů, jako např. hledání nejvhodnějších dokumentů obsahujících požadované informace, objevování nejzajímavějších informací v dostupných datech či další typy optimalizačních úloh, při nichž lze hodnoty cílové funkce získat pouze empiricky. Protože evoluční algoritmy pracují pouze s funkčními hodnotami optimalizované funkce, blíží s k jejímu optimu podstatně pomaleji než optimalizační metody pro hladké funkce, které využívají rovněž informace o gradientu optimalizované funkce, případně o jejích druhých derivacích. Tato vlastnost evolučních algoritmů je zvláště nepříjemná ve spojení se skutečností, že empirické získání hodnoty optimalizované funkce bývá obvykle značně nákladné i časově náročné. Evoluční algoritmy však lze podstatně urychlit tím, že při vyhodnocování funkční hodnoty optimalizované funkce používají empirickou optimalizovanou funkci jen občas, zatímco většinou vyhodnocují pouze její dostatečně přesný regresní model. K nejslibnějším regresním modelům patří modely založené na gaussovských procesech. Není proto divu, že právě ony patřily k prvním, které se pro urychlení evoluční optimalizace začaly používat. Přesto je výzkum urychlování evolučních algoritmů pomocí gaussovských procesů teprve v začátcích. Příspěvkem k němu by měla být i navržená práce. (http://www2.cs.cas.cz/~martin/)
Urychlení evoluční optimalizace pomocí neparametrické regrese
Školitel: doc. Ing. RNDr. Martin Holeňa, CSc.
Anotace: Evoluční algoritmy jsou v posledních 20 letech jednou z nejúspěšnějších metod pro řešení netradičních optimalizačních problémů, jako např. hledání nejvhodnějších dokumentů obsahujících požadované informace, objevování nejzajímavějších znalostí v dostupných datech, či další typy optimalizačních úloh, při nichž lze hodnoty cílové funkce získat pouze empiricky. Protože evoluční algoritmy používají pouze funkční hodnoty cílové funkce, blíží s k jejímu optimu mnohem pomaleji než optimalizační metody pro hladké funkce, které využívají rovněž informace o gradientu cílové funkce, případně i o jejích druhých derivacích. Tato vlastnost evolučních algoritmů je zvláště nevýhodná v kontextu nákladného a časově náročného empirického způsobu získávání hodnot cílové funkce. Evoluční algoritmy však lze podstatně urychlit, jestliže při vyhodnocování funkčních hodnot cílové funkce používají empirickou cílovou funkci jen občas, zatímco většinou vyhodnocují pouze dostatečně přesný regresní model této funkce. Většina regresních modelů je vybírána z rodin funkcí parametrizovaných konečným počtem předem daných parametrů, např. lineární regrese, polynomiální regrese, regrese založená na jádrových funkcích nebo na některých typech umělých neuronových sítí. Díky růstu výkonnosti počítačů však v posledních dvou desetiletích získaly značný význam i modely neparametrické. Ty jsou výpočetně náročnější, ale také flexibilnější a díky tomu univerzálnější. Jejich nejtradičnějším často používaným zástupcem jsou zobecněné aditivní modely. Výzkum využitelnosti neparametrických regresních modelů k urychlení evoluční optimalizace empirických funkcí je však teprve na samém počátku. Přispět by k němu měla i navržená práce. (http://www2.cs.cas.cz/~martin/)
Urychlení evolučních algoritmů pomocí náhodných lesů
Školitel: doc. Ing. RNDr. Martin Holeňa, CSc.
Anotace: Evoluční algoritmy jsou v posledních 20 letech jednou z nejúspěšnějších metod pro řešení netradičních optimalizačních problémů, jako např. hledání nejvhodnějších dokumentů obsahujících požadované informace, objevování nejzajímavějších informací v dostupných datech či další typy optimalizačních úloh, při nichž lze hodnoty cílové funkce získat pouze empiricky. Protože evoluční algoritmy pracují pouze s funkčními hodnotami optimalizované funkce, blíží s k jejímu optimu podstatně pomaleji než optimalizační metody pro hladké funkce, které využívají rovněž informace o gradientu optimalizované funkce, případně o jejích druhých derivacích. Tato vlastnost evolučních algoritmů je zvláště nevýhodná v kontextu nákladného a časově náročného empirického způsobu získávání hodnot cílové funkce. Evoluční algoritmy však lze podstatně urychlit, jestliže při vyhodnocování funkčních hodnot cílové funkce používají empirickou cílovou funkci jen občas, zatímco většinou vyhodnocují pouze dostatečně přesný regresní model této funkce. Jednoduchý, ale často používaný typ regresních modelů je specifický typ rozhodovacích stromů, tzv. regresní stromy. Od počátku minulého desetiletí se věnuje pozornost také vytváření kombinací rozhodovacích stromů, tzv. náhodných lesů. Výzkum využitelnosti náhodných lesů k urychlení evoluční optimalizace empirických funkcí je však teprve na samém počátku. Přispět by k němu měla i navrhovaná práce. (http://www2.cs.cas.cz/~martin/)
Fakulta elektrotechniky a komunikačních technologií VUT
Metody hlubokého učení pro zpracování obrazových dat
Školitel: doc. Ing. Radim Kolář, Ph.D.
Anotace: Toto téma se zabývá využitím moderních variant umělých neuronových sítí v oblastech zpracování a analýzy statických obrazů a videosekvencí. Během řešení se předpokládá hlubší studium pokročilých metod strojového učení především v oblasti konvolučních neuronových sítí, možnosti využití již naučených sítí na jiné aplikace, využití metod tzv. progresivního učení pro řešení nových a komplexních problémů, studium a modifikace rekurentních neuronových sítí pro segmentaci a sledování objektů v obrazových datech. Konkrétní aplikace budou zaměřeny především na segmentaci a sledování osob a objektů v obecných scénách, včetně detekce obličeje s využitím v oblasti biometrie a biomedicíny.
Pokročilé metody analýzy dynamiky variability srdečního rytmu
Školitel: doc. Ing. Jana Kolářová, Ph.D.
Anotace: Téma je zaměřeno na vývoj pokročilých metod pro analýzu dynamické složky variability srdečního rytmu. Cílem práce je propojit metody pro analýzu časových řad se současnými, převážně nelineárními, metodami analýzy variability srdečního rytmu, ověřit vlastnosti navrženého přístupu na experimentálních kardiologických datech, a popsat diskriminační schopnost navrženého přístupu v komparačních studiích.
Detekce a klasifikace metastatických lézí v páteři a dalších kostech na základě monoenergetických a spektrálních 3D CT obrazových dat, včetně analýzy trendu časového vývoje
Vliv hemodynamických dějů na elektrickou aktivitu izolovaného srdce
Školitel: doc. Ing. Jana Kolářová, Ph.D.
Anotace: Práce je zaměřena na analýzu experimentálních kardiologických dat. Cílem práce bude sledování hemodynamiky izolovaných srdcí ve vztahu k elektrofyziologickým dějům. První částí práce bude podrobné studium elektrofyziologických a hemodynamických dějů v srdci během jednotlivých srdečních fází. Druhá aplikační část bude zaměřena na návrh pokročilých algoritmů pro předzpracování a analýzu nasnímaných simultánních signálů. Výstupem práce bude popis dynamických dějů nastávajících během experimentů zaměřených na studium srdeční práce při změně zátěže. Databáze experimentálních dat je k dispozici na pracovišti školitele.
Školitel: prof. Ing. Jiří Jan, CSc.
Anotace: Návrh a vývoj nových metod analýzy CT obrazových dat pro automatickou detekci a klasifikaci lézí v páteři a dalších kostech, včetně sledování jejich časového vývoje v seriích CT vyšetření, se zaměřením na zlepšení diagnostiky v onkologických klinických aplikacích. Získání dat i medicínské hodnocení výsledků bude výsledkem spolupráce se zahraničními i tuzemskými lékařskými pracovišti. Téma je součástí dlouhodobého projektu řešeného v rámci smlouvy s firmou PHILIPS NEDERLAND; v rámci této smlouvy je možné poskytovat úspěšným studentům zajímavé pravidelné navýšení stipendia. Od uchazeče se kromě zájmu o výzkumnou práci v renomovaném týmu očekává schopnost tvůrčího myšlení a osvojování si publikovaných metod, formulace strukturovaných algoritmů, programování v prostředí MATLAB a předběžná znalost základní metodologie zpracování a analýzy obrazových dat.
Pokročilé algoritmy pro monitoring aktivity mobilními senzory
Školitel: Ing. Martin Vítek, Ph.D.
Anotace: Téma dizertační práce je zaměřeno na sledování a hodnocení aktivity jedinců s využitím senzorů běžně dostupných v mobilních zařízeních (akcelerometr, GPS, mikrofon, senzor srdečního tepu) a lze jej rozdělit na dvě části. Cílem první části je analyzovat možnosti mobilních zařízení, seznámit se s typy snímaných dat a posoudit jejich potenciál. Cílem druhé části je návrh pokročilých algoritmů pro zpracování nasnímaných dat za účelem identifikace jednotlivých druhů vykonávaných aktivit (odpočinek, chůze, běh). Od uchazeče se očekává znalost programování v prostředí Matlab a přehled v oblasti zpracování a analýzy 1D signálů.
Analýza 3D CT monoenergetických a spektrálních dat zaměřená na stanovení prostorové minerální hustoty kostí u norm. i okol. pacientů, včetně analýzy trendu časového vývoje
Školitel: prof. Ing. Jiří Jan, CSc.
Anotace: Návrh a vývoj nových metod analýzy CT obrazových dat pro automatické stanovení prostorové distribuce minerální hustoty kostí v CT obrazových datech a trendu jejího časového vývoje, se zaměřením na zlepšení diagnostiky v onkologických i jiných klinických aplikacích. Získání dat i medicínské hodnocení výsledků bude výsledkem spolupráce se zahraničními i tuzemskými lékařskými pracovišti. Téma je součástí dlouhodobého projektu řešeného v rámci smlouvy s firmou PHILIPS NEDERLAND; v rámci této smlouvy je možné poskytovat úspěšným studentům zajímavé pravidelné navýšení stipendia. Od uchazeče se kromě zájmu o výzkumnou práci v renomovaném týmu očekává schopnost tvůrčího myšlení a osvojování si publikovaných metod, formulace strukturovaných algoritmů, programování v prostředí MATLAB a předběžná znalost základní metodologie zpracování a analýzy obrazových dat.
Bioinformatická analýza genové exprese u kardiomyopatie
Školitel: prof. Ing. Ivo Provazník, Ph.D.
Anotace: Kardiomyopatie je častou příčinou selhání srdce a srdečních transplantaci. Tato studie má za cíl prozkoumat potenciální geny související s kardiomyopatií a dále zkoumat jejich základní regulační mechanismus za použití bioinformatiky. Budou použity profily genové exprese získané z Gene Expression Omnibus databáze. Diferenciálně exprimované geny budou vyhledávány porovnáním normálních a s kardiomyopatií souvisejících vzorků s využitím nových metod bioinformatiky. Dále budou predikovány potenciální transkripční faktory a microRNA těchto genů souvisejících s kardiomyopatií na základě jejich vazebných sekvencí. Kromě toho budou geny související s kardiomyopatií použity k nalezení malých molekul jako potenciálních terapeutických léčiv pro kardiomyopatii.