Wissen und Text (Text Mining Aufbau & Struktur v. Text, Wissensverarb. gestern & heute) 2 Grundl. der Bedeutungsanalyse ( Syntagmat. Relationen, Paradigmat. Rel., Semantische Rel., Logische Rel., Fach- & Allgemeinsprache) 3 Textdatenbanken (Textressourcen, Aufbau v. Textdatenbanken, Segmentierung v. Text, Datenstrukturen, Abfragemöglichkeiten) 4 Sprachstatistik (Zipfsche Gesetze, Differenzanalyse, Probabilistisches Sprachmodell, Hidden Markov-Modelle, Tagging, Signifikante Kookkurrenzen, Visualisierung von sign. Kookk., Anwend. auf andere Sprachen, Kookk. höherer Ordnung, Netze v. Kookkurrenten, Small Worlds u. skalenfreie Netze, Disambiguierung, Communities) 5 Clustering (Clustering-Verfahren, Dokumentenähnlichkeit, Clustern v. Wortformen, Merkmalsextraktion) 6 Musteranalyse (Reguläre Ausdrücke, Syntaktische Muster, Morphemmuster) 7 Hybride Verfahren (Lexikalische Filter, Kombination versch. Wissensquellen, Bootstrapping 8 Beispielanwendungen / Anhang (Ling. Grundlagen u. Statistik). Leseprobe„Text repräsentiert Wissen. Im Unterschied zu den strukturierten Daten einer Datenbank stellen Texte unstrukturierte Daten dar. Mit Hilfe von Text Mining-Werkzeugen können aus digital vorliegenden Texten neue und relevante sachliche und inhaltliche Zusammenhänge extrahiert werden. Text Mining basiert auf statistischen und musterbasierten Verfahren und erlaubt innovative Anwendungen im Wissensmanagement. Auf allen Ebenen der Wertschöpfungsketten spielt der gezielte Umgang mit Wissen eine zunehmend wichtige Rolle für die Effektivität und Effizienz von insbesondere mittleren und großen Unternehmen. Der Terminus Wissen bezeichnet dabei die meist auf Erfahrung beruhende und objektiv nachprüfbare Kenntnis von Fakten und Zusammenhängen eines Weltausschnitts, die Personen zur Lösung von Problemen einsetzen…“
Ein großer Teil des Weltwissens liegt in Form digitaler Texte im Internet und in Intranets. Diese digitalen Texte – die in den meisten natürlichen Sprachen vorliegen – stellen einen bedeutsamen und bisher kaum genutzten Wissensrohstoff dar. Lernen Sie in diesem ersten deutschen Lehrbuch zu diesem Thema, wie digitaler Text mit Hilfe des 'Text Mining' für das Wissensmanagement aufbereitet, verarbeitet und genutzt werden kann. Die behandelten Themen in diesem Buch: Wissen und Text, Grundlagen der Bedeutungsanalyse, Textdatenbanken, Sprachstatistik, Clustering, Musteranalyse, Hybride Verfahren, Beispielanwendungen, Anhänge: Statistik und linguistische Grundlagen