Webcrawler, Suchmaschinen und Informationsextraktion

netEstate hat jahrelange Erfahrung in der Programmierung von Crawlern und Suchmaschinen.

Unser Impressums-Crawler extrahiert Daten aus dem Impressum von Websites.

Unser Jobcrawler findet Stellenanzeigen auf einer Website.

Der Imagecrawler extrahiert repräsentative Bilder aus Seiten und wird bei unserem Twitter trend monitor eingesetzt.

Eigene Textklassifizierer trainieren und mit anderen teilen kann man mit unserem Angebot textclassify.com. Unsere Algorithmen unterstützen diverse Sprachen.

Unsere Website search engine durchsucht die Metadaten von mehr als 84 Mio Websites. Sie können Listen von dabei entdeckten Domains bei uns erwerben: Domain-Datenbank.

Unsere Personensuchmaschine FOAF search engine durchsucht über 6 Mio Einträge aus dem Social Semantic Web.

Für unser RSS directory haben wir über 50 Mio RSS-Feeds gecrawlt und deren Metadaten durchsuchbar gemacht.

Bei der Event search engine crawlen wir Events im hCalendar Mikroformat.

Der Crawler unserer Suchfunktion für die eigene Website extrahiert Metadaten wie HTTP-Statuscode, Dateityp, Sprache, Änderungszeitpunkt, Titel, Meta-Tags sowie den gesamten Textinhalt in unstrukturierter Form. Sie können diese Daten neben der Suchfunktion auch zum automatischen Generieren von Sitemaps nutzen oder im XML-Format exportieren.

Für unsere Kunden haben wir Webcrawler programmiert, die strukturierte Daten verschiedenster Art extrahieren. Die Daten können von bestimmten Websites oder dem Web allgemein gecrawlt werden. Im letzten Fall haben die Daten kein festes Format, keine feste Position auf der Website und keine feste Position innerhalb der Seiten. Wir versuchen dann Daten und Beiwerk durch syntaktische und semantische Merkmale zu trennen.

Cookies und Formulare sind für uns kein Hindernis. Wir beachten den Robots Exclusion Standard. Um den Versand von Spam-Email nicht zu unterstützen lehnen wir Aufträge ab, die nur auf die Gewinnung von E-Mail-Adressen abzielen.

Ihr Ansprechpartner bei netEstate:
Michael Brunnbauer
Tel: 089-32197780
E-Mail: info@netestate.de
Kontaktformular


Alle Preise inkl. MwSt. • (c) 2012 netEstate GmbH • Website powered by Zopilot®Impressum