Table Of ContentSemantische Suche für die Wissensentwicklung
in wissensintensiven Prozessen –
am Beispiel des Semantic Desktop in der Angebotsentwicklung
bei Siemens IT Solutions und Services
Vom Fachbereich Wirtschaftswissenschaften
der Universität Kaiserslautern genehmigte
Dissertation
vorgelegt von
Mark Siebert
Dipl.-Kfm.techn.
aus München
D 386
(2010)
2 Semantische Suche für die Wissensentwicklung in wissensintensiven Prozessen
Semantische Suche für die Wissensentwicklung in wissensintensiven Prozessen 3
Vorwort des Autors
Wissensmanagement hat die Phase des Dokumenten- und Contentmanagements überwunden. Mit
dem Web 2.0 entstehen erneut Technologien für den Umgang mit Wissen und erinnern an die Com-
munities of practice und Web-Communities der New-Economy-Zeit. Der kollaborative Umgang mit
Wissen löst langsam das Paradigma der Verteilung von Wissensobjekten ab. Es bricht die Vorstellun-
gen auf, Wissen als ein festgeschriebenes Produkt in verschiedenen Kontexten eins zu eins wieder-
verwenden zu können. Es berücksichtigt vielmehr den dynamischen und subjektiven Charakter von
Wissen und überbrückt damit die künstliche Trennung zwischen Wissenstechnologien und Personal-
management.
Meine Arbeit entstammt einer längeren Auseinandersetzung mit dem Phänomen „Wissen“ − zu-
nächst aus Sicht des betrieblichen Managements und der Innovationsforschung, dann aus philosophi-
scher und psychologischer Sicht. Meine Praxiserfahrungen im Wissensmanagement der Siemens AG
und in der Beratung anderer Unternehmen illustrierten die große Lücke zwischen Realität und An-
spruch und motivierten ein vertieftes Hinterfragen. Zu wenig wissen wir noch über diese wohl wich-
tigste Ressource unseres 21. Jahrhunderts und über deren Voraussetzungen.
Die Diskussion des Konstruktivismus zeigte neue Perspektiven und die Möglichkeit, Wissen aus
sich heraus als dynamisch und entwickelnd zu untersuchen. Das Phänomen der Rekursivität und
Selbstähnlichkeit auf unterschiedlichen Abstraktionsebenen waren schließlich Anlass, die Künstliche
Intelligenz mit ihren Technologien auf die Probe zu stellen. Welche innovativen Technologien könn-
ten einen solchen Gedankenansatz stützen und damit die Brücke zu einem neuen Umgang mit Wissen
bauen ?
Die Offenheit und Weitsicht von Prof. Dr. Dengel am DFKI (Deutschen Forschungszentrum für
Künstliche Intelligenz) in Kaiserslautern war es, die einen solchen interdisziplinären Gedankenansatz
und die unkomplizierte Projektbegleitung ermöglichte. Die Unterstützung meiner Vorgesetzten bei
Siemens IT Solutions und Services (Hr. Kapfenberger, Hr. Dr. Wagner, Hr. Dr. Tripp, Hr. Dr. Matzke)
und aus dem Wissensmanagement des Konzerns (insbesondere Hr. Ramhorst, Hr. Dr. Hofer-Alfeis)
erlaubte es, diesen Dialog praxisnah und anhand von realen, anonymisierten Daten aus dem Ange-
botsprozess durchzuführen. Sie ermöglichte mir die Rahmenbedingungen und beruflichen Freiräume,
mich dieser Diskussion neben der alltäglichen Arbeit zu widmen.
Mit der Bereitschaft von Prof. Dr. Wendt, sich in diesen Dialog einzubringen und die Arbeit ver-
antwortlich mitzutragen, ließen sich die ersten Erkenntnisse in das wissenschaftliche Spektrum der
Wirtschaftsinformatik einflechten und mit dem Nachweis ihrer statistische Signifikanz festigen.
Viele Freunde, Bekannte, Betreuer, Studenten, Diplomanden und Interessierte haben mich in den
einzelnen Arbeitsphasen und auf Workshops und Konferenzen begleitet. Sie haben durch ihre Fragen,
Anregungen, Kommentare, Korrekturen und Erfahrungen wesentliche Gedankenanstöße gegeben.
Ganz besonders möchte ich mich hier bei Heiko Maus, DFKI, und Pierre Smits, asknet, bedanken.
Heiko stand mir als DFKI-Betreuer jederzeit mit Rat und Tat zur Seite und erlaubte mir, Schritt für
Schritt die Welt der semantischen Technologien zu entdecken. Mit Pierre gelang es, die technischen
Tests im komplexen Systemrahmen eines Großkonzerns durchzuführen. Ich hoffe, dass unser Dialog
über die Zeit der Dissertation hinausreichen wird.
Begeistert hat mich das Interesse und der Einsatz der Studenten Oliver Schon, Thomas Ruegg, Jens
Hauser und Maik Keppel von der Bundeswehr-Universität München. Sie haben sich in ihrem Praxis-
programm für das Thema Wissensentwicklung eingesetzt. Sie waren in der Findungs- und Recherche-
phase eine wertvolle Hilfe.
Im Rückblick sehe ich mit Freude, dass sich der Aufwand des Zusammenspiels zwischen Universi-
tät und Wirtschaft sowie Technologie und Philosophie ausgezahlt hat. Auf diese Weise wurden nicht
nur neue Erkenntnisse für die Domäne der Wissensentwicklumg gewonnen, sondern auch innovative
4 Semantische Suche für die Wissensentwicklung in wissensintensiven Prozessen
Technologien in der Praxis getestet und Anregungen für den dynamischen Umgang mit den sich trans-
formierenden CRM-Prozessen im Siemens-Konzern gegeben.
Die Arbeit zeigt damit, dass semantische Technologien die Möglichkeitsgrenze der Technologie
zwar verschieben können, die Wissensentwicklung aber erst am Anfang ihres eigenen Erkenntnispro-
zesses steht. Mehr denn je und gerade in diesem Feld bin ich daher überzeugt, dass der interdisziplinä-
re Dialog uns hilft, voneinander zu lernen und neues Wissen zu entwickeln. Oft ist es nur die Seman-
tik, die uns trennt.
In diesem Sinne danke ich auch ganz herzlich meinen Eltern. Schon früh haben sie mich in meinen
neugierigen Fragen unterstützt und Einblicke in die interdisziplinäre wissenschaftliche Diskussion er-
möglicht. Das Andenken an meinen Vater hat mich in meinem Forschungsprozess begleitet.
Vielen Dank !
München, Januar 2010
Mark Siebert
Semantische Suche für die Wissensentwicklung in wissensintensiven Prozessen 5
Abbildungsverzeichnis
Abb. 1. Individuelle Wissensentwicklung im Angebotsprozess 16
Abb. 2. Treibende Faktoren für die Diskussion der Wissensentwicklung 21
Abb. 3. Forschungsvorgehen 31
Abb. 4. Iterativer Ablauf und Werdegang der Arbeit 32
Abb. 5. Grad der Datenstruktur in Bezug auf Datenhaltung 41
Abb. 6. Wissenstreppe nach North 48
Abb. 7. Komponenten des Wissensmanagements 58
Abb. 8. Kreislauf der Wissensentwicklung 60
Abb. 9. Boisot’s Social Learning Cycle (SLC) 61
Abb. 10. Mapping der Modelle von Boisot und Nonaka 61
Abb. 11. Wissensmodell der Siemens AG 62
Abb. 12. Einflussfaktoren im Umgang mit Wissensprodukten 70
Abb. 13. Konnektionistisches Modellsystem 82
Abb. 14. CBR Kreislauf 90
Abb. 15. Technologieintegration zur schrittweisen Abbildung von Wissen 104
Abb. 16. Gnowsis Architektur 112
Abb. 17. Indexierung unterschiedlicher Datenquellen und –formate 113
Abb. 18. Zusammenspiel individueller und organisatorischer Wissensräume 116
Abb. 19. Vergleich der Folderstrukturen von Sales und Proposal Manager bei SIS 117
Abb. 20. Bausteine der Semantischen Suche 118
Abb. 21. Schema und Abgrenzung der Qualität von Suchergebnissen 120
Abb. 22. Testszenarien in Abhängigkeit von Rolle und Wissensobjekt 122
Abb. 23. Ontologie - Informationsmodell 124
Abb. 24. Ontologie - Kundenmodell 125
Abb. 25. Ontologie - Organisationsmodell 125
Abb. 26. Ontologie - Produktmodell 125
Abb. 27. Ontologie - Rollenmodell 125
Abb. 28. Ontologie - Prozessmodell 126
Abb. 29. Screenshot (schematisch) Gnowsis für Szenario 1 128
Abb. 30. Screenshot (schematisch) Gnowsis für Szenario 2 129
Abb. 31. Screenshot (schematisch) Gnowsis für Szenario 3 131
Abb. 32. Screenshot (schematisch) Gnowsis für Szenario 4 133
Abb. 33. Verteilung Precisionwerte nach Suchbegriffen 135
Abb. 34. Verteilung Recallwerte nach Suchbegriffen 136
Abb. 35. Vergleich der ROC-Kurven zwischen Gnowsis und LiveLink 140
Abb. 36. Vergleich der ROC-Kurven zwischen Gnowsis und LiveLink mit erweiterter
Datenbasis 141
Abb. 37. Verteilung F-Werte nach Suchbegriffen 143
Abb. 38. Precision/ Recall Häufung LiveLink 144
Abb. 39. Precision/ Recall Häufungen Gnowsis S1 144
Abb. 40. Modell der Wissensentwicklung (Knowledge Creation Framework) 150
Abb. 41. Vernetzung von Wissenssystemen über Interaktionssysteme 154
Abb. 42. Wissensentwicklung als Prozess des „perspective taking und making“ 156
Abb. 43. Anwendung des KCF auf den Semantic Desktop zur Erstellung von
Suchergebnissen 157
Abb. 44. Inhalte im kommunikativen Dialog zwischen Abstraktionsebenen 161
Abb. 45. Rolle als Hebel zum Paradigmenwechsel der Wissensentwicklung aus
individueller Sicht 162
Abb. 46. Informationstechnische Modellierung der Rolle in der Verknüpfung von Prozess
und Architektur 163
Abb. 47. Mögliche Integration der semantischen Suche in Standardsoftware SAP CRM 164
Abb. 48. Weiterentwicklung des Semantic Desktop auf Basis des KCF 166
Abb. 49. Beitrag des Semantic Desktop zur Produktivitätssteigerung des Wissensarbeiters 171
6 Semantische Suche für die Wissensentwicklung in wissensintensiven Prozessen
Tabellenverzeichnis
Tabelle 1. Angewandtes Vorgehen der Grounded Theory 27
Tabelle 2. Ansatz der Design Sciences auf bekannte Aktefakte 29
Tabelle 3. Übersicht der Arten wissensintensiver Prozesse 37
Tabelle 4. Übersicht Angebotsprozess und informationstechnische Unterstützung bei SIS 38
Tabelle 5. Mögliche Entwicklung eines neuen Management Summaries (MS) aus
bestehenden Management Summaries 42
Tabelle 6. Rollen-Vergleich Sales und Proposal Manager 43
Tabelle 7. Einordnung der Erstellung von Management Summaries in die Prozessarten 45
Tabelle 8. Unterschiede zwischen Objektivismus und Konstruktivismus 52
Tabelle 9. Lernarten nach Gagné 65
Tabelle 10. Übersicht Systemtheorien als Basis der Künstlichen Intelligenz 73
Tabelle 11. Übersicht über diskussionsrelevante Verfahren der Künstlichen Intelligenz 75
Tabelle 12. Mögliche Verfahren zur Realisierung der technologischen Hebel 96
Tabelle 13. Technologiebausteine des Semantic Desktops 101
Tabelle 14. Einordnung beispielhafter semantischer Verfahren (hellgrau) als
Weiterentwicklung bestehender KI-Verfahren (dunkelgrau) 102
Tabelle 15. Beitrag der Technologien und der semantischen Suche in wissensintensiven
Prozessen 105
Tabelle 16. Wirkung verschiedener Optimierungsverfahren im Information Retrieval 108
Tabelle 17. Optimierungsverfahren des Information Retrieval auf verschiedenen
Abstraktionsebenen 109
Tabelle 18. Entwicklungspfad von der Volltextsuche zur Semantischen Suche 110
Tabelle 19. Beispielhafte Suchergebnisse für brainfiler und LiveLink 121
Tabelle 20. Ordnerstruktur eines Proposal Managers 124
Tabelle 21. Ordnerstruktur eines Sales Managers 124
Tabelle 22. Systemvoraussetzungen 126
Tabelle 23. Gesamtverbesserung gegenüber bisheriger LiveLink Suche (ohne Regeln) 126
Tabelle 24. Gesamtverbesserung gegenüber bisheriger Livelink Suche (mit Regeln) 127
Tabelle 25. Ergebnisse gegenüber Laborbedingungen 127
Tabelle 26. Ergebnisse Szenario 2 gegenüber Szenario 1 129
Tabelle 27. Ergebnisse Szenario 3 gegenüber Szenario 1 130
Tabelle 28. Ergebnisse Szenario 4 gegenüber Szenario 1 und Livelink 132
Tabelle 29. Ergebnisse Standardabweichung für Precision über die Szenarien 135
Tabelle 30. Ergebnisse Standardabweichung für Recall über die Szenarien 136
Tabelle 31. Übersicht möglicher Signifikanztest 137
Tabelle 32. Wilcoxon-Test für Precision – Szenario 1 138
Tabelle 33. Wilcoxon-Test für Recall – Szenario 1 138
Tabelle 34. Aufbereitete LiveLink-Ergebnisse für ROC-Kurve 140
Tabelle 35. Aufbereitete Gnowsis (S4)-Ergebnisse für ROC-Kurve 140
Tabelle 36. Ergebnisse des Wilcoxon-Tests der ROC-Kurven 141
Tabelle 38. Ergebnisse Standardabweichung für F-Werte über die Szenarien 143
Tabelle 39. Wilcoxon-Test für F-Werte 145
Tabelle 40. Zusammenfassung der Literaturdiskussion 149
Tabelle 41. Vergleich der Charakteristika von qualitativer Sozialforschung und
Wissensentwicklung 165
Tabelle 42. Mapping von Dokumententyp auf Storyline und Value proposition 167
Semantische Suche für die Wissensentwicklung in wissensintensiven Prozessen 7
Abkürzungsverzeichnis
ARIS Architecture integrierter Systeme
BDI Believe-Desire-Intention (Architekturen)
bzw. beziehungsweise
CBR Case-based reasoning
CKAT Coinstructive Knowledge Analysis of Tasks
CMS Content Management System
CRM Customer Relationship Management
DFKI Deutsches Forschungszentrum für Künstliche Intelligenz, Kaiserslau-
tern
d.h. das heißt
DMS Dokumenten Management System
etc. et cetera
engl. Englisch/ english
FIPA Foundations of Intelligent Physical Agents
ggfs. gegebenenfalls
KCF Knowledge Creation Framework
KI Künstliche Intelligenz
KNN Künstliche Neuronale Netze
LL LiveLink
MAS Multi-Agenten-Systeme
MS Management Summary
MIT Massachusetts Institute of Technology
NLP Natural Language Processing
OWL Web Ontology Language
PAT Proposal Automation Tools
P2P peer-to-peer
PIMO Personal Information Model
PLM Product Lifecycle Management
pp. pages
PRS Procedural Reasoning System
RAP Reactive Action Packages
RDF(S) Resource Description Framework (Schema)
S. Seite
S1, S2, S3, S4 (Test-)Szenario 1, 2, 3, 4
SECI Socialisation, Externalization, Combination, Internalisation (Nonaka)
SIS Siemens IT Solutions and Services
SLC Social Learning Cycle (Boisot)
sog. sogenannt
v.a. vor allem
W3C World Wide Web Consortium
WM Wissensmanagement
WMS Wissens Management System
z.B. zum Beispiel
Abkürzungen von Programmiersprachen werden im Text direkt erläutert
8 Semantische Suche für die Wissensentwicklung in wissensintensiven Prozessen
Inhaltsverzeichnis
Vorwort des Autors 3
Abbildungsverzeichnis 5
Tabellenverzeichnis 6
Abkürzungsverzeichnis 7
Inhaltsverzeichnis 8
Zusammenfassung 12
Summary (engl.) 13
1 Motivation 15
1.1 Wissensverteilung ist nicht ausreichend für aktive Unterstützung
wissensintensiver Prozesse 15
1.2 Fehlende Prozesse und statische Tools erlauben keine aktive Prozessunter-
stützung 16
1.3 Leistungsfähigkeit neuer, intelligenter und semantischer Technologien
noch nicht hinreichend deutlich 18
1.4 Repräsentation des subjektiven Charakters von Wissen derzeit nicht
technologisch abgebildet 19
1.5 Hoher Redaktionsaufwand für Einsatz von Wissensmanagement-
Technologie 19
1.6 Monodisziplinäre Ansätze der Wissenstheorie blockieren das Verständnis
der individuellen Wissensentwicklung 20
2 Ziel und Beitrag der Arbeit 21
3 Forschungsansatz und -methode 23
3.1 Wissenschaftstheorie – Forschungsansatz oder
Wissensentwicklungsprozess 23
3.2 Besonderheiten naturwissenschaftlicher Ansätze 24
3.3 Besonderheiten sozialwissenschaftlicher Ansätze 24
3.4 Besonderheiten betriebswirtschaftlicher Ansätze 25
3.5 Besonderheiten kombinierter Ansätze 25
3.5.1 Action Research 26
3.5.2 Design Sciences 26
3.5.3 Grounded Theory 27
3.6 Wahl der Forschungsmethode 28
4 Anwendung der Forschungsmethode als Forschungsvorgehen 31
5 Forschungsfragen und Aufbau der Arbeit 33
6 Wissensintensive Prozesse 37
6.1 Angebotsprozess der SIS 38
6.2 Erstellung von Management Summaries 40
6.3 Value selling und value proposition 41
Semantische Suche für die Wissensentwicklung in wissensintensiven Prozessen 9
6.4 Bedeutung der Rollen im Prozess 43
6.4.1 Rolle Sales Manager 44
6.4.2 Rolle Proposal Manager 44
6.5 Zwischenfazit 44
7 Verständnis von Wissen 47
7.1 Wissen – Begriffliche Abgrenzung als wiederverwendbare Ressource 47
7.2 Wissen − Wissensentwicklung und Konstruktion 49
7.3 Exkurs − Konstruktivismus 50
7.3.1 Grundlagen und Vertreter des Konstruktivismus 50
7.3.2 Der Realismus als Abgrenzung des Konstruktivismus 51
7.3.3 Kernelemente des Konstruktivismus aus der Erkenntnistheorie 52
7.3.3.1 Realität und Wirklichkeit im neurobiologischen Konstruktivismus
bei Maturana und Roth 52
7.3.3.2 Wissen als anwendbare Wirklichkeit im Radikalen
Konstruktivismus 53
7.3.3.3 Realität als Konsens individueller Wirklichkeiten im sozialen
Konstruktivismus 53
7.3.4 Kernaussagen Kritik und Schlussfolgerung 54
7.4 Zwischenfazit 55
8 Wissensentwicklung – begriffliche Einordnung 57
8.1 Wissensentwicklung – im betriebswirtschaftlichen, organisationalen
Rahmen des Wissensmanagements 57
8.1.1 Wissensentwicklung im Modell von Probst 59
8.1.2 Wissensentwicklung bei Nonaka und Takeuchi 59
8.1.3 Wissensentwicklung bei Boisot 60
8.1.4 Wissensentwicklung im Modell der Siemens AG 62
8.1.5 Zwischenfazit betriebswirtschaftlicher Diskussion 62
8.2 Wissensentwicklung – eine Frage der Kommunikation 63
8.3 Wissensentwicklung – lerntheoretische Grundlagen 63
8.3.1 Lernen als Wissenserwerb 64
8.3.2 Lernen als Verhaltensänderung 66
8.3.3 Lernen als (neuro-)biologische Veränderung 67
8.4 Wissensentwicklung – psycho-linguistische Sprachproduktion 67
8.5 Wissensentwicklung – psychologische Diskussion der Bewusstseinsbildung 69
8.6 Zwischenfazit 69
9 Relevante Methoden und Technologien der Künstlichen Intelligenz
für die Wissensentwicklung 73
9.1 Repräsentation 75
9.1.1 Feature-Maps und Netze als symbolische Repräsentation auf Signalebene 77
9.1.2 Ontologien als symbolische Repräsentation auf Bedeutungsebene 77
9.1.2.1 Resource Description Framework (Schema) – RDF (S) 78
9.1.2.2 Web Ontology Language − OWL 79
10 Semantische Suche für die Wissensentwicklung in wissensintensiven Prozessen
9.1.3 Konnektionistische Netze als subsymbolische Repräsentation auf
Konzeptebene 79
9.2 Mustererkennung 83
9.2.1 Stochastik und überwachtes Lernen als symbolische Mustererkennung auf
Signalebene 85
9.2.2 Ontology mapping und merging als Mustererkennung auf Bedeutungsebene 86
9.2.3 Holistische Ansätze als subsymbolische Mustererkennung auf
Konzeptebene 87
9.3 Problemlösung 88
9.3.1 Reasoning als allgemeines, symbolisches Problemlösen auf Signalebene 89
9.3.2 Multi-perspective und case-based reasoning als symbolisches Problemlösen
auf Bedeutungsebene 89
9.3.3 Agent-based solving als subsymbolisches Problemlösen auf Konzeptebene 91
9.4 Zwischenfazit 94
10 Semantic Desktop im Applikationsumfeld 99
10.1 Wissensmanagementsysteme (WMS) und Portale 99
10.2 Proposal Automation Tools 100
10.3 Recommendersysteme 100
10.4 Semantic Desktop 100
10.5 Zwischenfazit 103
11 Gnowsis − Semantische Suche im Semantic Desktop 107
11.1 Kontext des Information Retrievals 107
11.2 Formen und Arten semantischer Suchen 110
11.3 Besonderheiten von Gnowsis 112
11.3.1 Aufbau von Gnowsis 112
11.3.2 Klassifikation mit dem brainfiler 113
11.3.3 Ontology mapping und matching 114
11.3.4 Personal Information Model (PIMO) als Katalysator für Peer-to-Peer 115
11.4 Gnowsis im Spektrum semantischer Suchen 118
11.5 Testansatz 119
11.5.1 Testmethode 120
11.5.2 Testszenarien 121
11.6 Testbasis 123
11.6.1 Datenbasis und Ordnerstrukturen 123
11.6.2 Organisatorische Ontologie 124
11.6.3 Systemvoraussetzungen 126
11.7 Testergebnisse 126
11.7.1 Erfahrungsberichte werden bestätigt 127
11.7.2 In homogenen Gruppen wirkt die Rolle auf die Ergebnisschärfe 128
11.7.3 In heterogenen Gruppen wirkt die Rolle auf die Zugänglichkeit relevanter
Objekte 130
11.7.4 In unstrukturierten Gruppen wirkt die Rolle eher ergebnisschärfend 132
11.7.5 Insgesamt wirkt die Rolle, aber gruppenspezifisch 133
11.8 Testgüte 134
11.8.1 Signifikanzanalyse der Testergebnisse 134
Description:Neben der reinen Sprache verbreitern Programmiertechniken wie JBoss AOP, Nanning, and. Aspectwerkz (aspect-oriented Oracle Fusion Middlerware (http://www.oracle.com/lang/de/products/middleware/). 13.4 Auswirkungen auf das Frankfurt u.a., pp. 407-444, 2002, http://www.ldv.uni-.