Gugli Webcrawler
Gugli ist ein Windows-Programm. Es besucht automatisch Webseiten und speichert die dort gefundenen Informationen in einer Datenbank.
Gugli kann man hier downloaden, es gibt außerdem eine Online-Hilfe zu dem Programm.
Wozu braucht man Gugli ?
Mit Gugli lassen sich umfangreiche Datenbestände mit hohem Informationsgehalt aufbauen.
Diese Datenbestände dienen im wesentlichen dazu, Suchmaschinen zu realisieren und damit
gezielte Suchanfragen zu beantworten.
Wer hat Verwendung für Gugli ?
Jeder der Interesse daran hat, eine eigene Suchmaschine zu realisieren. Sie benötigt lediglich ein
paar Zeilen php und MySql zum Zugriff auf Ihre Datenbank.
Die Besonderheit von Gugli besteht darin, daß die Datenbank landesspezifisch aufgebaut werden kann. Sie erzielen daher schon mit kleinen Datenbeständen sehr gute
Suchergebnisse.
Was kann Gugli nicht ?
Gugli generiert lediglich die Datensätze, die für eine eigene Suchfunktion benötigt werden. Es stellt keine Programmteile zur Verfügung, die für eine Suchfunktion im Web
erforderlich sind. Dies sind insbesondere an das jeweilige Seitenlayout angepaßte php-Scripte, welche die Daten aus der Datenbank abfragen und auswerten.
Zur Erstellung dieser Scripte sind Grundkenntnisse der Programmiersprachen HTML für das Seitenlayout sowie PHP für die Datenbankabfrage erforderlich.
Features:
-Webcrawler nach dem Schneeballprinzip
-Verwendete Datenbank = MySql
-Neu gefundene Links sind neue Zieladressen
-Speichern der Startseite (Texte und Meta-Informationen sowie zugehörige IP-Adresse)
-Selektive Suche in der Datenbank nach Text sowie IP & zugehörigen URL's möglich (intern).
-Export von Seiteninhalten und Url möglich, Exportoptionen
(MySql-Fulltext -> SQL export, Dateigröße / Anzahl Datensätze stufenlos einstellbar - Splitoption)
-Bewertungssystem nach Linkpopularität
-Wiederaufnahme nach erreichen von maxwerten möglich
-Datenbank kann auf local- oder remotehost installiert werden
-Spam- & Adult Filter
-Table-Edit Funktion integriert
-Session-Log möglich
-Durch Verwendung von separaten Tables für alle Domains (de, com etc.) spezielle Datensätze beim Export möglich
-Bis zu 9 Crawler je Datenbank möglich bei Datenbank auf remotehost
-Bis zu 3 Crawler je Datenbank möglich bei Datenbank auf localhost (>2 Ghz System)
-Automatische Erkennung von Netzwerkunterbrechungen (DSL), Sleepmode
-Crawl-Limit einstellbar (Zeitlimit & Bytelimit per Session / Tageslimits bei aktivierter Wiederaufnahme)
-Robot & Meta-Check (index,follow)
-Revisit & Refresh Zeitlimit konfigurierbar (min wait für Crawl & Refresh)
-Refresh wird durchgeführt bei Verweis auf eine Seite, dadurch hohe Aktualisierungfrequenz für bekannte Webseiten
-Kein zwischenspeichern der Seiten auf lokalem Datenträger
| Version | 1.3.7.0 |
|
||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Sprache |
|
|||||||||||
| Betriebssystem | Windows 9x / Windows NT / Windows .XP | |||||||||||
| Lizenztyp | Freeware | |||||||||||
| Größe |
|
|||||||||||
| Herstellerurl | Link | |||||||||||
| Zugewiesene Tags | Informationen - Webseiten - Speichern - Internet | |||||||||||
| Fehler melden | ||||||||||||
| Aktuelle Bewertung unserer User | 3 Punkte in 0 Bewertungen | |||||||||||
| Wie bewerten Sie diese Software? |
|
|||||||||||
Jetzt zum Download ...
