Zeitgeschichte online Recherchieren von 1955 bis 2005 mit modernsten Retrievalkomponenten Rüdiger...

Zeitgeschichte onlineRecherchieren von 1955 bis 2005 mit modernsten Retrievalkomponenten

Rüdiger Baumberger, Content Manager APA-DeFacto

ODOK’05, Bozen

Die APA-Gruppe

APA-DeFacto einer der mächtigsten Medienhosts im deutschsprachigen Raum ist spezialisiert auf:

• Individuelle Informationslösungen• Qualitative Analyse der Medieninhalte• Beschlagwortung und Verknüpfen

relevanter Inhalte• Aufbau und Integration von Wissensportalen

APA-DeFacto - Datenbankpool

• Multimediale Datenbanken – 175 Agentur-Datenbanken– 175 nationale und internationale

Zeitungen/Zeitschriften teilweise im Original-Design (PDF)

– Firmeninformationen– Bilder, Grafiken, Audios– Termine

• > 52 Mio. Dokumente

• Täglich 60.000 neue Dokumente in Real Time

1849 Oesterreichische CorrespondenzJoseph Tuwora

1859 Telegraphen-Korrespondenz-Bureauab 1867 „k.k.“

1922 Amtliche Nachrichtenstelle ANAunter staatlicher Leitung

1938 „Zweigstelle Wien“des Deutschen Nachrichten-Büros

1946 APA - Austria Presse Agentur1988 Erste APA-Datenbank

Die Geschichte der APA

Das APA-Archiv

Deckblatt des Tagesdossiers vom 1. Jänner 1955

Das Dossier „Jochen Rindt“

APA 02.07.1960

• 1200 Archivordner

• 1,3 Millionen Seiten

• 3 Millionen Meldungen

• 6 Monate OCR-Durchlauf

• 250 GB Daten

Eckdaten

• Spiritusabzüge

• Endlosdruck

• Keine Titel und Stichworte

• Originalnummerierungen nicht verwertbar

• Fehlbestände

Herausforderungen

• Rettung des Archivs(?)

• Lückenlose Digitalisierung des gesamten Bestandes

• Einbindung in bestehende Retrievalsysteme

• Recherche im Volltext

• Faksimile

• Dossiers

• weltweit einziges digitales Agenturarchiv – Volltext!

• einmaliges historisches Material

• Volltextdatenbank inkl. Faksimiles der Originale

• 52 Dossiers

• AOM undwww.defacto.at

Ergebnis

APA-OnlineManager (AOM) Recherchetool für Datenbankabfragen• Über 7500 User • 1500 User gleichzeitig• 21 Millionen Recherchen/Suchen pro Jahr• 36 Millionen Objekt/Artikel-Abrufe pro Jahr

• 24 Stunden / 7 Tage Hotline• Hohe Ausfallsicherheit durch Unix-Cluster und

EMC-Plattensysteme

Bestand versus Nutzung• Dokumentbestand

reicht zurück bis 1955

• Die meisten der Abfragen beziehen sich auf Dokumente der letzten Wochen

Anteil historischer Dokumente nach zeitlicher Tiefe

Zielsetzung des Projektes mit Know-Center Graz• Durch Erweiterung der Suchmöglichkeiten

um intelligenten Retrievalkomponenten soll der User

– ohne komplexe Suchanfragen schnellstmöglich relevante Treffer erzielen

– einen raschen Überblick über die Suchergebnisse bekommen (großer Archivbestand)

– weiterführende Informationen zu Suchthema erhalten

Themen Clustering• Aussagekräftige Clusterbeschreibungen

(Uniwords und Phrasen)– Extraktion aus Volltext– Keine a priori Themenvorgabe

• Effiziente Implementierung – Clustering von 2000 Artikel dauert etwa 3 Sekunden

Themen-Visualisierung• Visualisierung der Treffermenge

– basierend auf Clustern– Zeitliche Visualisierung von Themenverläufen– Ein-, zwei- und dreidimensionale Darstellung (Landscape

Visualisierung)

• Navigation in der Treffermenge über die Visualisierungsmetaphern

Ähnlichkeitssuche

• Suche von „ähnlichen“ Meldungen – Basis ist das Vector Space Model– Extraktion von Schlüsselwörter der aktuellen Meldung

• Verweis auf weiterführende Dokumente über (semiautomatisch) extrahierte Personen/Firmen

Beispiel: Bibliothekar

Trefferliste mit Visualisierung der

Themencluster

Anzeige Trefferstatistik

Natürlichsprachliche Formulierung der

Suchanfrage

Auswahl eines Themas per Mouseclick

Link zu weiterführender Information

Auswahl eines Dokumentes und Durchführen einer

Ähnlichkeitssuche

Neue Trefferliste, neue Cluste

Herzlichen Dank!

Rüdiger Baumbergerruediger.baumberger@apa.at

www.apa-defacto.atwww.defacto.at

Zeitgeschichte online Recherchieren von 1955 bis 2005 mit modernsten Retrievalkomponenten Rüdiger...

Documents

Transcript of Zeitgeschichte online Recherchieren von 1955 bis 2005 mit modernsten Retrievalkomponenten Rüdiger...

1 Semiautomatische Medienresonanz- und Diffusions-Analyse Waltraud Wiedermann, GF APA-DeFacto und APA-MediaWatch Michael Granitzer, Know-Center.

Improvisation als Chance für Jugendliche Drei ... · Improvisation als Chance für Jugendliche Drei theaterpädagogische Ansätze Katharina Baumberger 3 Markenkleidung tragen und

Poster:SekundärePflanzenstoffeinSojaLebensmitteln · Pflanzenstoffe in Soja-Lebensmitteln informiert. Gestalten Sie das Poster für eine Präsentation. Recherchieren Sie zunächst

Recherchieren 2.0: Social Media als Ergänzung der journalistischen Recherche – am Beispiel Twitter

Eine runde Sache - sanitas.com · «Im Zirkel gibt es keine Wartezeiten», erklärt . Hanspeter Baumberger, Leiter Bereich Fit-nesspark & Milandia, einen Hauptvorteil des vollautomatischen

LEP-Anwenderkonferenz Donnerstag, 9. November 2017 LEP-Anwenderkonferenz Donnerstag, 9. November 2017 Mapping LEP -CHOP 99.C1 2018 Dr. Dieter Baumberger, Dr. Renate Ranegger, Martin

Marktlücken · PORTFOLIO AUFSTIEG prof1546_AUFSTIEG_vertrieb_Di15.indd 54 06.11.15 17:59 Persönliches Exemplar für AOM-Benutzer fo-prazak - (C) APA-DeFacto GmbH. Alle Rechte vorbehalten.

1 Recherchieren, publizieren, kommunizieren. Kommunikative Formen im Online- Journalismus Gabriele Hooffacker.

Stand Juni 2015 - defacto.at · Die DeFacto-Suchmaschine ist ohne Grundgebühr mittels Online-Banking nutzbar. Gebühren entstehen erst beim Absetzen ... Bei der "Schnellsuche" können

Chronologie des Rombachtälis «Das Tal der ungeahnten ......Baumberger, 1923: Die Eisen- und Manganerze der Schweiz. – Beiträge zur Geologie der Schweiz, geotechnische Serie, Lieferung

E-Mail-Marketing: Passende Datenbasis des Kunden recherchieren

Hammerl Helmut RECHERCHIEREN .

Kurs: Recherchieren: Kataloge 1/16 Dr. Barbara Hoffmann LiteraturKompetenz 08.02.2008 Kurs Recherchieren und Bibliografieren Der Kurs ist zur allgemeinen.

Ketchum Publico - Pressespiegel...Ketchum Publico - Pressespiegel 31.1.2020 Dieser Pressespiegel ist ein Produkt der APA-DeFacto GmbH und dient ausschließlich Ihrer persönlichen

Forschen. organisieren. recherchieren. unternehmen. moderieren Die SAMTGEMEINDE SCHWAFÖRDEN im demografischen Wandel Vorstellung der Ergebnisse der Fallstudie.

Terminologie PRÜFEN, MANAGEN und RECHERCHIEREN

Daten suchen, recherchieren und sortierenAdressen gesucht. Recherchieren Recherchieren → Rechercheart im Menüband unter »Recherche« auswählen → Ggf. bestehende Recherche »löschen«,

Fachinformation nutzen plus: Volltexte und Open Access - Recherchieren in Suchmaschinen, Katalogen und Datenbanken - Wissensorganisation mit Citavi

Smartwatch-Studie - BVDW...Smartwatch-Studie Gemeinsame Erhebung von Bundesverband Digitale Wirtschaft (BVDW) e.V., DAYONE GmbH und defacto digital research GmbH zur Verbreitung und

Kunst im Alten Konsum Mels - kakmels.chkakmels.ch/fileadmin/siteadministration/pdf/moesch_baumberger.pdfAcryl auf Papier / 50 x 70 cm Kunst im Alten Konsum Mels: FRANZ BAUMBERGER 1940