Auswahl und Klassifizierung externer Informationen zur Integration in ein Data Warehouse

6
1 Einleitung Das nahezu exponentielle Wachstum der Quellen fu Èr externe Informationen ± ins- besondere im Internet ± macht es notwen- dig, Wege fu Èr einen effektiven und effizi- enten Zugriff auf Daten durch Auswahl und Klassifizierung zu finden. Ziel dieses Beitrages ist es, hierfu Èr Lo Èsungsmo Èglich- keiten aufzuzeigen. 2 Integration externer Informationen 2.1 Prozess der Auswahl externer Quellen Im Vergleich zur Auswahl interner Infor- mationsquellen gestaltet sich die fu È r exter- ne Informationen ungleich schwieriger. Die heutzutage wichtigste Quelle stellt das World Wide Web (WWW) dar. Wegen der vorzufindenden Informa- tionsvielfalt ist eine systematische Suche und Identifikation von relevanten Infor- mationen unabdingbare Voraussetzung fu Èr eine effektive Nutzung. Ein unter dem Be- griff Web Farming bekanntes Verfahren beschreibt das systematische Auffinden von WWW-Inhalten und deren Einspei- cherung in ein Data Warehouse. Web Far- ming vollzieht sich idealtypisch in folgen- den Schritten [Hack96; Bold99]: 1. Identifikation von unternehmens- kritischen Schlu Èsselobjekten: Als Objekte kommen z. B. Wettbewer- ber, Kunden, Lieferanten und Partner, bestimmte Kennzahlen wie z. B. Akti- enkurse oder Branchenkennzahlen, aber auch Pressemitteilungen von Wettbewerbern in Betracht. Die Ermitt- lung und Festlegung dieser Schlu Èssel- objekte ist abha Èngig vom Aufbau und den Inhalten des Data Warehouses. 2. Zuordnung der Schlu È sselobjekte zu den Angeboten im WWW: Es mu Èssen die potenziellen Informa- tionsquellen aufgefunden und ange- bunden werden. Die Recherche nach den jeweiligen WWW-Servern kann beispielsweise mit Hilfe von Suchma- schinen ausgefu Èhrt werden, News- Ticker und Online-Informationsdienste ko Ènnen abonniert und integriert wer- den. 3. Systematische Untersuchung des WWW-Angebots: Die Seiteninhalte sind zu analysieren. Im Falle dynamischer Quellen mu Èssen eventuell geeignete Parameter spezifi- ziert werden. 4. Analyse des extrahierten Inhalts: Entscheidend ist die Extraktion der we- sentlichen Inhalte. Dabei kommen u. a. linguistische Analysen und/oder auto- matische Bilderkennung zum Einsatz. 5. Strukturierung im Hinblick auf das Data Warehouse-Schema: Die aufgefundenen Informationen mu Èssen entsprechend aufbereitet und den vorab definierten Schlu Èssel- objekten thematisch zugeordnet wer- den. Danach werden sie mit einer zeit- lichen Kennzeichnung in das Data Warehouse u Èbernommen. 6. Bekanntmachung der Information: Die U È bernahme der oftmals schnell veralteten Informationen in das Data Warehouse genu È gt nicht. Die neuen In- formationen mu Èssen durch ein internes Marketing in Form von E-Mails oder periodischen News den Anwendern bekannt gemacht werden. 2.2 Einbindung von Informationsdiensten Da selbst groûe Unternehmen die no Ètigen Ressourcen an Personal und Budgets fu Èr das Sammeln und Auswerten externer In- formationsmengen nicht aufbringen ko Èn- nen oder wollen, haben sich am Markt professionelle Informationsdienste etab- liert. Unter wirtschaftlichen Gesichtspunk- ten erscheint es sinnvoll, mo Èglichst viele externe Informationen u Èber elektronische Dienste zu beziehen. Dies liegt sowohl in der schnelleren, unkomplizierteren Inte- gration der Daten in ein Data Warehouse als auch im Aufwand fu Èr eine manuelle Dateneingabe, z. B. aus Zeitschriften, was fehleranfa Èlliger und wegen der Personal- kosten in der Regel teurer ist, begru Èndet. Im Hinblick auf die Qualita Èt von Infor- mationsdiensten sind folgende Aspekte zu pru Èfen: WIRTSCHAFTSINFORMATIK 41 (1999) 5 S. 443 ± 448 443 WI ± Schwerpunktaufsatz Auswahl und Klassifizierung externer Informationen zur Integration in ein Data Warehouse Wolfgang Behme, Harry Mucksch Dr. Wolfgang Behme, ORACLE Deutschland GmbH, Baumschulenallee 16, D-30625 Hannover; Dr. Harry Mucksch, Servicezentrum INFOKOM GmbH, Bahnhofstr. 15, D-26871 Papenburg

Transcript of Auswahl und Klassifizierung externer Informationen zur Integration in ein Data Warehouse

Page 1: Auswahl und Klassifizierung externer Informationen zur Integration in ein Data Warehouse

� ��������

2� ����/ �3%��������� -�$� � ���< ����� � �� �3���� ������������ � ���#������� �� ������ � ��$� � �� ������� -��� � �� ����� ����.���� �� ����/������ 0 ����� � � 2��� � �$� 7 ��� �� ������/��� �� / ������, 0��� ����������� � �� ����� �� 1�� ��������$��.���� � �/ /�����,

� ���� ����� ���� �� ���� ��������

�&� � �!��� �� "�6������� �� H�����

�� F������$� / � 7 ��� ������� �����������4 ����� ����� �$� ��� � �� �3����� ������������ �����$� $� �������,2�� �� / ��� �$���� < ���� ��� ��-����-���-�# )---+ ���,-���� ��� ���/ ��������� ��������

���������� � ���� �����$�� � $�� �� �������.���� ��� ��������� ������������� ��#����#���F��� �/ �� � ������ ����.��� = / ��, ��� ��� ��� �������� -�# ������� #�.���� F��������#�$����# �� �����$�� 7 ���������� ---�������� �� ����� ���%���$��� �� �� ��� 2�� -����� �, -�# �������� ����/��� �$� ������%�$� �� ���������� �$����� &:�$.'>N ����''(D

*, �������.���� ��� ����������.���$��� �$�� ����#G�.��D7� @#G�.� .����� /, �, -�#� ���#��� � ����� 1��������� �� �������#����� ����/����� �� /, �, 7.����. �� ���� ����$���.���/�������#�� � $� ��������� ���� ���-�#� ��#��� �� ����$�, 2�� ������ �� �� ����� �� ����� �$�� �����#G�.� � �#������� ��� 7 �#� ����� ������� �� 2�� -����� �,

9, 0 ���� �� ��� �$�� ����#G�.� / ���7���#��� ��---D� � ��� ��� %���/������ �����������4 ����� � ���� ���� �� �����# ���� �����, 2�� 8�$���$�� ��$���� G� ������� ---�������� .���#��%��� ��� �� :���� ��� � $����$����� � ��� ��� ������ =� �6�$.�� �� @���������������������.������ �#������ �� �������� ������,

I, ������$�� ���� $� �� ��---�7���#�D2�� ����������� ��� / ����������,�� ����� ������$��� < ����� � ������� ��� �������� �������� %�/����/��� �����,

A, 7����� �� �3�������� �����D��$������� � ��� �3��.��� ��� ������$��� ������, 2�#�� .����� , �,���� ��$�� 7������ ��M���� � �����$�� ������.��� �� / � ����/,

;, �� . ���� �� ��:��#��$. � � �� 2��-����� ���$����D2�� � ���� ������ ������������� ��� ��%��$���� � �#����� ����� ����# ���������� �$�� �����#G�.�� �����$� / ������� ������, 2���$� ����� �� �� ����� /�����$��� ����/��$�� �� �� �� 2��-����� � �#��������,

>, ��.�����$� �� ��� ����������D2�� ��#������� ��� ����� $������������� ������������ �� �� 2��-����� � ��� �� ��$�, 2�� �� �� ������������� � ��� � �$� ��� ���������.���� �� ���� ��� ������ ����%������$��� =� ��� 7� ������#�.��� ����$� �����,

�&� �������� ������� ���������������

2� ��# ���!� ���������� ��� �������8�� �$�� �� ������� �� � ��� � ���� ������� �� 7 ���� �3����� ����������������� ��$� � �#������ .������� ���� ������ ��#�� �$� �� ���.%����������� ��������������� ��#�����, ���� ��$�����$��� "��$�% �.��� ��$���� � �������� ������$� ������3���� ������������ �#�� ���.����$��2���� / #�/�����, 2�� ���� � ��� ����� $���������� �.��%��/������� ���������� ��� 2��� �� ��� 2�� -����� ��� � $� �� 7 � ��� � �� ���� ��� ����2��������#�� /, �, � 0��$������� ������������������ �� ���� ��� ��������.��� �� ��� 8���� � ��� �� #��� ����,�� :��#��$. � � ��� < ����� ��� ������

����������� ��� �������� 7%�.� / %� ����D

-�86�5:7�6��=�@8�76�� A* )*'''+ ; �, AAI � AAC ��+

�� � ��� ������������

"�6��� ����������!�� �

���� �� ���� ��������! ���� ����� �� ������� � �����

��"� �� ������ # ��$ ��%��%�

2�, -������� ������ @8751�2� $�����"�#:� �� �$� �������� *>�2�I?>9; :�������N2�, :���� � $.$�� �����$�/��� ��=�@�@�"�#:� ��������, *;�2�9>CB* ��%��# ��

Page 2: Auswahl und Klassifizierung externer Informationen zur Integration in ein Data Warehouse

��!����� 3�%�� >� ? ����

���

���� � ��������!�� ��# ��� ��� �. ���� �� ���� ��������

� �.��%��/���� �� %���� ����� �����������#�$���� ���

� � . ����� 2����� ���� � � �����$�� ��$����# �� ��� ����� �� 7 �#� ��� 2����

� ����� ��� �� 2�������� �� �� . �� �� ��� � ����$�� 2��� �#��������

� < ����� ��� ):�%���3+�� � ��������� ��������������#��� ���� " �� ��� ����#����� ������������� � ������������� 6��������#�����

� ����� �� ���� ��� �������������� 8�$�� ����� �� � � ��$� ���$���$������������2��������� )��$� ��$�@������0��+�

� ���� �/ �� .��� ��.����� � �.������ )"�� �� / ������� =�/�� ��2������ @����������� ��.����+ ��

� ������$�.���� / � ������%����� �$� 7#������� #������ �������������,

4 ��������!�� ��9�J����#����� ���� �� ���� ��������

�� "�����/ / ��� ������� 2��� ����3���� ��������� ����� � ��$��.���������#���� < ������ #��������7��%����� �� ��� �� �� ����. / ���

$���#���� ���� ���# ����, 7����� ���F���/��� ������$��� �3����� �����������4 ����� ��$� ��� 7 ��� ��$���� ���������� �� ��� ������������ �� � $����� 7 �� �� ��� .��%��/����� ��#�� ������� 2���,������.���� #�� � � � 2�.��%����,

2�� ��������� ������.���� � �� �3���������������� ��� ���� �$� ����������� %%�� )���� *+� ��� ��$�������� ������%�/���/��� �����D

4&� =�6���# ��� ���

2�� �� . � ��� �� ��.������� � �� ����9 ��������,2�� ���/��$��� �� ��#����� ����

#�/��$���� ��$�� ������������� ��� 7.�������� �� ���� �� ����� ����%���$����� �� "��/��# ������� #�������� ����� ������� #�����/� 8������/� �� �� ���������� ��#�� &����'I� I>(,�#��� .������ � $� ���"��/� � �� ����� 8�$������� %����������� @������������ ���� �����, 2�� �������� �� �� ����� ������ �� ����� 7 !��#�����$� $���� � $� �������� ���� �.������ /, �, 0�������� )7 !��#����$�+��� "��/�� / � ���������������� �� )�����#����$�+ ���$������ ���

���, 2�� ��.�����$��� �� ���������������� ������� ������������ ����� ���

���� � =�6���# ��� ���

$�����$��� 7��������� �� / / �������D ��� ���� ��$�����$��� #� ��� / ��� ���������%�/���$��� ��$����� ��� �� 7#�/����.��, �� ��� /, �,������������ #�/ ����$� ��� �� ��/����%��� .�� �$.� �� ��� "��� ���$��� / .������������ ������������ / ���. ���������� ��� ��� ����$�� ������������ ���� � � ��� 7#�/� ���� ���

Page 3: Auswahl und Klassifizierung externer Informationen zur Integration in ein Data Warehouse

$���� ������.�� ��� ��� ���., ��F��#��� �� �� ��� �� ���� B ����������F�� ��� ��.������� .��� ��� �����$���� $��������� � �� ����� ����� %�/����/��� �����, ���� 6�$�������� .������/, �, ������������ #�/ ����$� ����� .����������� �� ���� .������������������������ # ���� ������ � �� ����� 0�� �$� ���. ��/����� ����� .��#��/�.��� �� ���3�#��� ���� .������������� ������� ��$����, �3���������������� �� /, �, ���������� �����/���� ��������� 6�������������������� ��� -����� �����$�����$��� -���.������ �� ��� �/���. � ������ ������� � ���� �����, "����� �� 2� $������� �#�� � $� �� � ��%���$��� ������� ����� ��� �� �����/� � �� ������#�/ ����$�� ����#����� ��� � ����� ������ �$����� &����'I� A?(, 2�� ��� � �$����@� .������ ������$���� �����.���8�$�� �� �������,

4&� O ����������# ��� ���

2�� @���������.������� )���� I+ ��� ��7����� �� �� �, �, ����� -��.�� / ������ �� ����������$�� ���.���� ��/ � ������� �� -��$���%� ���.�������� ���������� &���C'(,����� ����� ��� ��/ � / � 7�������

��� �� �� ���������� ��������, ������� �$� � ������������� ��� /, �,� � ���� .����� ���� .�� %%� )� �$������+� ���� �����$�� "�$����������)# ���+ ���� �� ���/� ����������)$��%����+ / � "������� ��#��, 2��2�.��%�� -��$���%� ���.����� ������� �� 0 ��������� �� ��� �����������$��� �������� ���� #����������� ��� ���� � .������ -���.��������������� ��� 7.������� ����� ���$�������� "�$������������/ ������� �����, 2�� %�������� 6�����.���� #�/����� �$� � � ��� ����� �� ����� ���� .�� ��� F��.� �� ��� 6���%�� �� ��� �����$�� ������� ��� ��� ��/����� ��� ��$���� ��� 6�$����������� �$.� ��� ������� ��$��� � �� ������������������� . � �����&8�%%'A� CC(, 2�� ���� �� ����� ��������� ����# �$� � ��� -��$�����$��.��%���/�% �� 0������ G���� �� �������������� �������� �� �� ������ ��� ����/���� ������ � / � �������� �� ��� �3����� ������������ ���,

���� � O ����������# ��� ���

4&4 ������# ��� ���

2�� �� ���� A ���������� �������� ������������ �3���� ������������ #�/ ����$������ 8������/ � �� ��� ���� �� ���/ �������,2�� ���� �� �� ��# ��� /����$�� 8��

�����/ ��� �3����� ���������� ��, 2������� � ������ �� � �� ���� ��HH � #G�.��� � �� G���$� ���� ����$���� ��� �� ����� �3���� ������������ ����

���� � ������# ��� ���

�� �� %������ ���� �������� 5����.����#��, �� �� /, �, ���� ���������� �#��������� 0���� ����� �� ������� ����� �� � �� ������� ��� �����/�����$��� -��%�%�����, �#��� #G�.�� ������ ���.���� ���� ���� �� ����HH ���������������HH� G���$� ��� �� � �� ����� $�� � �$� ����#���� ��� ���� �� ����������$�,

���

&����! ��# ,!��������� ��� ���� �� ���� %�������

��������� �� � �� � �����

0���� "�6� ���� �� "���*��� ���� �� ����� � ����� � �� � �� ���0� ����� ��� ��� ����������� ��� ���� �������� ���� �. ��� ��������9���� )� ������#���� '����� �� � �J������ ������!�� �� ��������9����& � ���#��� �� ���K

� ��9���.�!��� "�6����� ��� �� , �� 5� ���/�

� ���������� ��� ��������#���������� ���� ,@��� �����/ ��

� ������� ��� ��������#������ ���� �. ���� �� ���� �������� �� &

���������������������� ��.�!���*������ ���� � ������ ���� �������� �� 5� ���� @��� �����

Page 4: Auswahl und Klassifizierung externer Informationen zur Integration in ein Data Warehouse

��!����� 3�%�� >� ? ����

���

4&8 B� #����# ��� ���

��� ��� 2��� �#������� ��� ������� ������������� �� ��� 2�� -����� � ������ ��� 2�.��%����� ��� ��� :���. ��.������� )���� ;+ # ���� ������ ����� � ����$� ����������,2�� ���������������� ��HH #�/���

�$� � � ��%� �� �� 7��� ��� 7 ������� ����� ���������� �� ��� 2�� -������ �, 2 �$� ��� #����� �������)/, �, ��� 1������� ��������� �#�� �������#���� ���� .�����+ ����� #������ ������������ � ����� )��� ������� ����HH+� ������������������ #��/��$���� ��� ������������ 2��� ��������#���� )/, �, 7������� �� ��� ���� �����/����� ��� ���$��� � ������+� ������� ������������������� / ������ �� ��� ������ � ��������$�.����� � ����$��� 7#� �#��.�� ��� �����������HH ��� ��������!���� � ����$���2��� �#������� #�� ������� 2��� ��������, � .������ ���� #�� �$.�$��� ������ �#��� ��� �� ��� �3����� ������������� ��������� < ����� ��� � ������� ������ ���� �3���� =�$���$���)/, �,:�%�����. #��---�2�. �����+,

���� � B� #����# ��� ���

4&3 H����)��# ��� ���

2�� �� ���� > ���������� < �����.�������� #�/����� �$� � � ����������������=� � �� /����$�� ������� �� ��� ������� �3����� ������������,���� -�#� ��#���$�% �.��

.��� ��� �3.� ����� ����� ����������)/, �, ���� ������� ������ ���.����$� ��+ #������� ���� �� ��#��,7 $� ��� ���%��3��� ����� ���� �� ��

���� � H����)��# ��� ���

��� ������ M������$�� ���%��3������ .���� ��� �$���� �������� / � ����� ������ ������ ����#�� ��#����� ����/ � �����$��� �� ��� ����%������,:, �, 7���� ���/�% ��� $� �$���

������� &7��B>� *I;( .��� #�� ��� �� ����� �� ��� ���� ���� ����� ����������� / :���� �������� �����, �� .������� �3���� ���� �� $��� / �������$� �� ���� 0��% �.� G���$� #�� ��$��������� 7#$���/#��.�� ��� 7 ��. ������ ������� �� �� 2�� -����� � �������, 2���� ���$�������%�. � � $�������� � �� ��� ���� �� �� .��� �� / ���/��$���� ����������� ����.��� � �� �������� � ������ �� � �� ���� ��HH ���� / �����, 2�� ��=� � ��� ����������HH� � �� ��� 7 �#� ��� ����/����������� ���� � �� ����.� F������$�� �� �������� 2��� �$���, 2� / ��/��$� / ������� �� ��HH #�� ��� ���� ��.��������� ����� ���.��� �� 0��#�/ � ���/ � ����� � � ��� /����$��� 7 ��. �����M8������/ ��� =�$���$��� �#������/ � ������� .��� � � $� / ��������!����� 2���#������ #�� ���� ��� ��� �����, -������� 4 ������� ������������� #��%��� ��� �� %������ 0���������

������� F�� ��� �� ������ .������� �/, �, ��� ���� ��� �� ��� ���. ���� ������� ��� �� ����� �� �� "�������� ���F����������� %���� %����� #�� ������.���� ��� �� ����� "����� �#���� ���,

4&7 0� 6�����9# ��� ���

��� ��� F�� ��� ��.������� )���� B+.����� ��� :�����$��� ���� ������ �����8��� �� � �� ���� #����� ��������������%��$��� �����,

���� � 0� 6�����# ��� ���

�� 0 ��������� �� ��� "��������� �� �� ��� %�������� �������������%������� .������ �3.� ��� 0 ��������$�� � ��� ��� 7������� �� ������������������� �� =�$���$�������� ��������� ���������� �3������ � ��������� �����D /, �, � � ��� �����$� �� ������������ � � ���� :�����$��� �� ����� � ���� #����� ����� �� 0 ��������$�� � � �� �� 2���, 2�� ������$�.����� ���#��� �� �� 7�������� ����.��� ��� ����������M �#��$�� ���� �� � �� ����� ������� #����# ��$�����$��7������ ������� �� ��� ��� �����$��� ��. ������� � $����.��� � �� ���#��� /�� ���, 2� ���.��� ��F������$�#��.���� ������� 2���HH ��� ��� ����� #��F������$��� $� �/��D ���%��� ���.��� ��� 5�� ��� ���� ���. �������� ���� 5�� ��� �������� ���� �������#�� ������� 7������ �#��$��� ��� �����@%������ 5�� ��� ����$��� ���,2�� ������$�� 7� ��� �����������%��������� ��� ��� �� 0 ���������

Page 5: Auswahl und Klassifizierung externer Informationen zur Integration in ein Data Warehouse

���� � "���������� ��������#����� ���� �� ���� �������� ��� @��� ����� P�� "�������� '���22� �1:Q

�� ��� < �����.����� � ��=� � ��� �����������HH � /��, 2�� ����.��� ����$������$��� 2����� ���� )#��%��� ���� 6�#������ "����.�� #� ��� / �����4 ��/��+ ��� ������$�,

8 @��� ����� ! ���������� �����������#�����

2�� %�������� ������.���� ��� �#�� ������� �� --- �� ���� ��� 6�3�� ������������ �3����� ������������ �#������ ��� �� ���������� / � F��� �� ��������� 8�� �$�� #�� ����, 7#�����.������ ��$������ �/� F�������� $�������� ��� ��#������ ��� � �� ������ ������������� ���������� �� ������ ������������#���� ������.���� )/, �, ��$���� �� ��%��� I ���������� �$����+ ���� 2�� -����� � ����������, ��� ���$�� F�������� ��� �$� /, �, �� :���� ��6�3 ������ ����������,6�3 ������ ��� ���� �� ���� �� ��

2�������������/�% � � 4 �������7������#G�.� ��� �� �� �� @#��#������� � �� �����$�� �������� �� ������$� �#�.����� �#�� %���/���� � �/��$��������������� ��� ��%��/� �� ���!��6�3���� ���� ������� ���� � �������� ����, 7� "� ��� �.����� ������� 7�/������������ ������.�������������� ��� 0�������������� ��������� / � F��� �� �� &����''� *?>(D

� 2�� 7�/����������� ���� / � ������ �� ��� -�$���#�/��� ���� / ��

$��� �������� � �������� ���������� ��������# ��� 2�. ����� ��/ �$��� ���$������$��� 2�. ������, � ��� ����� � ��������� ����� / ������������� 6�3� �� :������� �$���� ������ ����/��� ���� �����$����!��� ������$�� 7�/������������� ����� .������ &��:�'>� IAIN�770'B� *>B(, �� :���� ��� ����������� %%��HH )7���� ��� #��������� 6�3��� F�������� / � ������ 6�3�����+ �� ��5�������$�HH )7���� ��� 6�3�� ������ ������� �� ���.� ��� ����$�/����� ��� �����+ ��� �$� ��� ����#�������� � � ��.� -�$���#�/��� �������$�����.�� &����'>� 9;C(,

� 2�� ������.���� ���� / � ��$��������� ������� �� ��� 6�3�� �� ���� ���7�/��� ������������� ����� &��2�';�**9N 6.�$'C� 9I(, 2�� ��$����# �� �������� ������ �� :���� ��� �$�� ����#��������� ��� ����� � ������� �� �6�3� ���� 2�. ���� ��%��$��������� ����� �� ��� ����� � �/ �������, � ��� 0 ���� �� ��$� ����� ��/ ������� � .������ 6�3� ������������� / �� ���� �����, �� ��������� � � �������� ��� 0 ��������.�� ������� ��������� �$�� ��� / #� �����,

� 2�� ��������� �� ���� / � �������� �� ��� 6�3������ �� "� %%��� ��#�� ���� �� �$� ������$� ��������/ �������� �#�� ������$� ����������� �����, 2�� / � "������ �� #����������� �����$����� #/ , ������ ���6�3� .������ ����� � / � ��$�����# �� ��� "� %%� �������/���� ������ &1:��'>� 9ICN 0���'B� 9CB(, ��

"�����/ / � ������.���� ������ �������$���� �� ��� 6�3� ��$� ��$������� �������� �������� �� ��� ��$���� 7� ����� �� �������#��, ����7����� �� :���� ��� ��������� ����$. ��$������ �$� ��% �.� ���������# ��� 6�3����#��. � � �� ���������� 7��/% �.� � �� ���������������� $� ����,

� 2�� 0�������������� #��� ��� �������$�.��� F��$���# ���� ��������# ���6�3������� �#�� 0����� �� ��� ��� �/ ��$.��, 2�/ ��� �� F��.������ #������ 6�3������ �#�� /�����$�� �������� ��� �� ������ �� ���$����!��� �����$� ��������, 6����.������ � ��� � �� ���/���� �������� ��� $� � �� / ���/� ���/� ������ �����&1�7�'B� 99B(,

� 2�� ������� F��� ��#��.�� ��� �. ������ -��$��������������� �� ������� ��������$� �� 6�3 ������ � �� . �/������� �������/ �$.� ���/ �/��,7 � ��� �����$��� 6�3.������������ �� ����� �������$��� ����� �� ���� �$� 7 ���� �#�� ���/ . ������ �� �$.� �� ��� 7�������#G�.� �#����� &-�15'C� I>A(,

2�� . �/� ��$����# �� ��� � �.�����/���� �� 6�3 ������ �� :���� ��� �������.����� �.����� �3���� ������������� �����! ����� �������#���� 8���/ ����� )���, ���� C+, ����� �%��$��� ����� ����� � � �������� ������ / #������/��� #��� �$� / ��/��$� ��� ����/ ����-�# -���� ��, 2 �$� �� 7 #��������� -��#������������� ��� �$� �������� ��� �%��$���#����� ���������� ����������� ����������� �� -��#�������� ���� �� .�����/��� �����,

3 �J����#����� �� ���� �� � �����

���� ��� �3����� 2��� �� ��� �� ��$���� �� . � �� ��� 2���#�� �� 2��-����� � �#��� ���� � .������ �� #���%��� ��� � �$� �������� 7������� ����� ���������������� ��F�������� / ����. ���� / � ���. ����/ �/��� � ��� ��� �����D

� ������� ���������7� ���. ������������ ��� ��� ����� $� �� ����� 2��� ��� ���. �����/ ��������� #�/��$���� ��� � �������� ��$���� ���� �� 8����� ���

���

&����! ��# ,!��������� ��� ���� �� ���� %�������

Page 6: Auswahl und Klassifizierung externer Informationen zur Integration in ein Data Warehouse

��!����� 3�%�� >� ? ����

��'

�����$��� ����������%��� ����� ���� �� ��� &����'I� >I(,

� ��������� � �������� ��$� ������2�� ����$���� . ������� ��� ���� . ������ ���.���� ��� ����$����������/������ ��� ��� ����.� ��� -��#� ��#.����� �� ������$� ��� 8���#������ ��� ����$�� #������ &���C'� 9;(,

� ��� ����������� ���.������ ��� ��� ���� �$� �� ��� �����$����� �#������/������.�� 6�������.� �������.�������������� &����'I� >'(,

� ���� ������������������2�� ���� .��#��/�.� � ��� 0����� � ��� ��� ���� �� ��� ����� .���� #� / � 7 $������ �� ����� .� � ������. �� �/ �$� � ��� ���� ��/�.� � �� ������./�.� / ����� &����'I� BI(,

� ������� ��� ��� ����������� ���$� �����2� -��.���������� ��� ��� ����������� �� 7����� �� ��� 6����.����� ���� ��� � ��� ��� ������ � ������� . ���/ ����� �� / ������.���, ����/����� -�#� ��#�������.������ � �$� ��� 7����� ��� �����$����� / �$��� ��� -��.��� ������. ������ �����$���/ �����&8�%%'A� CB(,

� � �� ������� ���������������2�� �����$�� �/������������ ���� $� ��� / . ������ �� ���� ���� ����������� �� -�#� ��# ����� ���������� ������$��� 0 . ��#���������/ ������ � ��� ����4 ��/�����$�������� �������� / �������&����'I� '; �,(,

� ����������� 2� ��������%�$�������.����������������� )����+ ����� %�/���$��2��� ��� �����$��� "�$������������� ���$�������� ���������� ����� $� ������ 4 �������� �� 4 ��������� F����#��� � ������� ���� ���� ���.� %��$�HH / ������, ������������� �������� .������ � � ��� ���������� 2��� / � �$.������� �� ����� �������� ������ ����� #� ����&����'I� '' ��,(,

<��� ��

&7��B>( ( ��""� �� ������������� �%��� �����$���� �� � �����$ ��%��� � ��. ������, ��D 0��$���� � �� #����# ��$������$�� ���$� �� )*'B>+ I,

&����''( 5����� ,�+"�� �) �!+���!������&��6�3 ������ �� �����$��� 5���������, ��D:�2 )*'''+ 9?B� �, *?I�**A,

&����''( 5�+��� ��%� �+���� � %�� ���������������$ � ��� ���������$� #� �������$���� ������� �� ����������8�� �$� ����-�#, �81D �%DMM �#�������,$��M����M����,���� 7#� � �� *'''�?>�*B,

&����'>( 5�++ ���� �,D 7�/����������� � 7������ ���� 2�� ������ F��������, ��D ���������. �%�.� � *' )*''>+ ;� �, 9;B�9>*,

&�770'B( 4�+��� � 0�) (!�� � 7�) (��� (�)

/+ ����� � (�) �+�#��� � ,�D ��3���� 7��$����� 8 ��D � =� 6��� ��� ������ ��� ���� ��� $���$$ ����$� �� 2�$ ��� 5����$����, ��D :�$.������ 2,N �������� :,N�����#��� 2,N �� � ���� 8, ):��,+D ����$������ �� �� 6���� ����������� 5��������$� �� ��� ����� 2�$����� R 2�� �������� ����� ���. 57 *''B� �, *>B�*B?,

&��2�';( 4�+��� � 0�) ��� � ��D ��� �����2�$����� �� 6�3 �� 2��#�� )�26+, ��D������� �, �,N �� � ���� 8, ):��,+D ����$������ �� �� ��� ����������� 5��������$� �� ��� ����� 2�$����� R 2�� �������� ����� ���. 57 *'';� �, **9�**B,

&��:�'>( 4�+��� � 0�) ����� ��D ������ 7��$����� �� 6�3 �� �� �����$� �� ��$.���� �� ��� �����, ��D ���� ��� �,N :��� K,N������� �, ):��,+D ���$������ �� �� ���$��� ����������� 5�������$� �� ��� ������ 2�$����� R 2�� ������� ����� ���. 57*''>� �, IAI�IA>,

&:�$.'>( ��%&����� � 0%���� �� -�# �������� ��� 2�� -����� ���, ������ 6�$�������� ��$,� @$�#�� *''>� �81D �%DMM ,#�����,$��M �#��������,%��� 7#� ��� *''C�?9�*A,

&����'I( ���&� �!�� �����!�� ������$������������%��� ��� ;, 7 ������ � ���*''I,

&� ��'C( �!%&�%�� �����) 5����� ,�+"�� �

-�����.� 2� 2�� -����� �����/�%� 7��$���. � � 2���������� � 7� ��� �����I, �#����#���� 7 ������ "�#���� -��#����*''C,

&1�7�'B( *� �� 5�) (���3�+� 0�) ��&� �� 0�� 2��$������� 6���� �� 6�3 2��#��, ��D :�.�.������ 2,N �������� :,N �����#��� 2,N �� �� ���� 8, ):��,+D ���$������ �� �� 6��������������� 5�������$� �� ��� �����2�$����� R 2�� ������� ����� ���. 57*''B� �, 99B�9I?,

&1:��'>( *��!�� ��) �� &�+�� ��) ���&� �� ) ��'�� � � ��� �����@�����/��� ��% �� 2�$ ���� 5����$���D 7 =� 7%%���$� � ������$��� �3%�������, ��D ���� ��� �,N :��� K,N������� �, ):��,+D ���$������ �� �� ���$��� ����������� 5�������$� �� ��� ������ 2�$����� R 2�� ������� ����� ���. 57*''>� �, 9IC�9AI,

&� :8'>( �!%&�%�� �����) ��+��!�� �� ) 0�'

���� ���%!�� 2� 2���-����� � ���/�% ���� ��#��#��$., ��D -�86�5:7�6���=�@8�76�� IC )*''>+ A� �, A9*�AII,

&=�-''( 6��3��& ,$����� ������ 2������ ����� K�� ��� *'''� �81D �%DMM�%,� ,$��M/���M---M��%��,���� 7#� � �� *'''�?>�*B,

&�,F,''( ��<�� 5��% �� �. ���� ;?? ??? ��������2�����, ��D ���$� ��R 1���� )*'''+ >��, I?',

&8���''( 0��2 6��� 8�%� 8����� :�$� ��K �� '� �%DMM�%,� ,$��M/���M---M��%��,���N �81D�%DMM�%,� ,$��M/���M---M��%��,���N �81D�%DMM ,��%�,��M���$M��$� �,���� 7#� � �� *'''�?>�*B,

&���C'( ������� �� 2�� -�#� ��#������������.� �M���� *'C',

&8�%%'A( 0��������� (�� ����������� F�� �D-������� �� �� ��!�# � �� ��� ������������ ��� ��� � ��� *''A,

&6.�$'C( �&�%�� � ��� ���������� ������ ���� ��� ��������� ����� ������� 7� ������ ��� ��� ��� -��� ��%��� �������)5����$�$ + *''C,

&-�15'C( ,!# ���%�� 5�) ����! ��++�&�� �

*�! �� �� ) ���� <� /�� �� ��) *�� ,,D 2���������$��� �� ��G�� ��$. ����$� ���� 6�3� �� --- 2��, ��D 7��� ��� 8,N �����/� �,):��,+D ���$������ �� �� �� �� ������������ 5�������$� �� ��� ����� 2�$��������2�� ������� *''C� �, I>A�I>C,

&0���'B( /���� 8� 2�$� � 8�) ���� � 8�)����� 0� �,D �� ��� �� ���� 5� ����� ��-�# 2�$ ���, ��D :�$.������ 2,N ��������� :,N �����#��� 2,N �� � ���� 8, ):��,+D���$������ �� �� 6���� ����������� 5��������$� �� ��� ����� 2�$����� R 2�� �������� ����� ���. 57 *''B� �, 9CB�9'?,