Downloadliste

Projektbeschreibung

DataparkSearch is a Web search engine tool. It features support for http, https, ftp, nntp, and news URLs, htdb virtual URL support for
indexing SQL databases, text/html, text/xml, text/plain, audio/mpeg (MP3), and image/gif mime types built-in support, external parsers
support for other document types, the ability to index multilangual sites using content negotiation, searching of all of the word forms
using ispell affixes and dictionaries, stopwords and synonyms lists, boolean query language support, results sorting by relevancy, popularity
rank, last modified time, and importance (a multiplication of the relevancy and popularity ranks), support for various character sets, and
phrases segmenting for the Chinese, Japanese, Korean, and Thai languages. It has accent-insensitive search, mod_dpsearch for Apache, and support for internationalized domain names.

Systemanforderungen

Die Systemvoraussetzungen sind nicht definiert
Information regarding Project Releases and Project Resources. Note that the information here is a quote from Freecode.com page, and the downloads themselves may not be hosted on OSDN.

2010-01-25 21:30
4.53

Die ReverseAliasProg, ExcerptMark, SectionSQL und MaxHrefsPerServer Befehle wurden hinzugefügt. Eine schnellere Hash-Funktion implementiert. Das Match-Kommando wurde für Stoppwörter Dateien hinzugefügt. Die Esitemap Kommando wurde für Indexer aufgenommen. Multithreaded Ergebnis sortieren umgesetzt wurde (mit bis zu 32 Threads parallel). Unterstützung für libextractor wurde hinzugefügt. Akronym-Dateien wurden von regex Grundlage Transformationen erweitert. Die Länge der Maximim Protokolldatensätze wurde auf 480 Byte, die IST-Größe für einen Syslog-Meldung erweitert. Der Limit-Befehl wurde erweitert, um SQL-basierte Grenzen akzeptieren.
Tags: minor changes and cleanup
The ReverseAliasProg, ExcerptMark, SectionSQL, and MaxHrefsPerServer commands have been added. A faster hash function was implemented. The Match command has been added for stopwords files. The Esitemap command has been added for indexer. Multithreaded result sorting has been implemented (with up to 32 threads in parallel). Support for libextractor has been added. Acronym files have been extended by regex based transformations. The maximim length of log records has been enlarged to 480 bytes, the MUST size for a syslog message. The Limit command has been extended to accept SQL-based limits.

2009-04-25 17:49
4.52

Die fleißigen Timeout wurde für SQLite erhöht. SkipHrefIn und SEASections Befehle wurden hinzugefügt. Ein Disallow-Befehl in "robots.txt" führt nicht mehr zur Entfernung aus der Datenbank zu dokumentieren. Ein Quffix Befehl wurde hinzugefügt. Searchd reinigt nun die Suche Cache auf config Laden / Nachladen. Time Zone Verarbeitung ist für Last-Modified-Header und Meta aufgenommen. Ein MakePrefixes Befehl wurde hinzugefügt. Einige Bugs wurden gefixt.
The busy timeout has been increased for SQLite. SkipHrefIn and SEASections commands were added. A Disallow command in robots.txt no longer leads to document removal from the database. A Quffix command was added. Searchd now cleans up the search cache on config loading/reloading. Time zone processing has been added for Last-Modified header and meta. A MakePrefixes command was added. Several bugs were fixed.

2009-01-01 06:27
4.51

CAS-basierte Synchronisation ist für die i386/x86_64-Plattform realisiert. Die ActionSQL, FastHrefCheck, SubDocCnt, andSubDocLevel Befehle wurden hinzugefügt. Unterstützung für die KOI8-C (eine Verlängerung der KOI8-R mit alten russischen Buchstaben) charset wurde hinzugefügt. HrefSection Verarbeitung wurde in der XML-Parser behoben. A $ (url.directory) Meta-Variable wurde hinzugefügt. Ein allin <section>: Betreiber hat die für die Suchanfrage Sprache aufgenommen.
Tags: Minor feature enhancements
CAS-based synchronization has been implemented for the i386/x86_64 platform. The ActionSQL, FastHrefCheck, SubDocCnt, andSubDocLevel commands have been added. Support for the KOI8-C (an extension of KOI8-R with old-Russian letters) charset has been added. HrefSection processing has been fixed in the XML parser. A $(url.directory) meta-variable has been added. An allin&lt;section&gt;: operator has been added to the search query language.

2008-07-27 15:53
4.50

Die strikte Option wurde für den Abschnitt Befehl hinzugefügt. Ein Wort zu brechen ist für Französisch-Stil Kontraktionen aufgenommen. Die MaxSiteLevel Befehl akzeptiert jetzt ein negatives Argument Gruppe URLs, die auf ein Unterverzeichnis Basis. Einige deutsche Buchstaben werden automatisch ersetzt durch bi-Buchstaben-Kombinationen in Akzent-freien Suchmodus. SQLite3 Unterstützung wurde hinzugefügt. Indizierung wurde für Dokumente mit mehreren Versionen in verschiedenen Sprachen behoben. Relevanz Berechnung wurde für Fälle, in denen Akronyme und Abkürzungen verwendet werden, verbessert.
Tags: Minor feature enhancements
The strict option has been added for the Section command. A word break has been added for French-style contractions. The MaxSiteLevel command now accepts a negative argument to group URLs on a subdirectory basis. Some German letters are automatically replaced by bi-letter combinations in accent-free search mode. SQLite3 support has been added. Indexing has been fixed for documents with several versions in different languages. Relevance calculation has been improved for cases when acronyms and abbreviations are used.

2008-02-13 07:41
4.49

String-Token wurde verbessert. Eine Indizierung Filialdokument Technik umgesetzt wurde. Die LongestTextItems Befehl wurde hinzugefügt. Die Unterstützung wurde für die georgische hat-Akademie und georgisch-ps Zeichensätze. Der HTML-Parser überspringt jetzt die Indizierung innerhalb von Tags mit Sicht auf "none" oder "versteckt" in das style-Attribut gesetzt. A $ * (x) die Art der Vorlage Meta-Variable wurde hinzugefügt. Die PagesInGroup Befehl wurde hinzugefügt. Die ServerWeight Befehl wurde behoben.
Tags: Minor feature enhancements
String tokenization has been improved. A
subdocument indexing technique has been
implemented. The LongestTextItems command has been
added. Support has been added for the
georgian-academy and georgian-ps charsets. The
HTML parser now skips indexing within tags with
visibility set to "none" or "hidden" in the style
attribute. A $*(x) type of template meta-variable
has been added. The PagesInGroup command has been
added. The ServerWeight command has been fixed.

Project Resources