
Suchmaschinen
Suchmaschinen
Python Podcast · Jochen Wersdörfer / Dominik Geldmacher
February 24, 20201h 36m
Show Notes
<article class="post-detail"> <header> <h2 class="post-title"> <a href="https://python-podcast.de/show/suchmaschinen/">Suchmaschinen</a> (click here to comment) </h2> <!-- link is on one line to avoid underlined whitespace --> <div class="post-card-meta"> <a href="https://python-podcast.de/show/suchmaschinen/"><time datetime="2020-02-25T00:00:00+01:00">25. Februar 2020</time>,</a> <span class="author">Jochen</span> </div> </header> <div class="post-body"> <section class="block-overview"> <section class="block-paragraph"> Heute ging es um Volltextsuchmaschinen.<br />
<br />
Wir sprechen darüber, was die so grundsätzlich tun und wie man sie von Python aus verwenden kann, oder auch selbst eine implementieren könnte. Weitere Themen waren die Relevanz von Suchergebnissen, SEO und alles Mögliche drumherum. Zudem haben wir unsere Androhung aus früheren Episoden wahr gemacht und sprechen ein wenig über das pathlib Modul aus der Standardbibliothek.<br />
<br />
</section> <section class="block-audio"> </section> <section class="block-paragraph"> <br />
<br />
</section> </section> <section class="block-detail"> <section class="block-paragraph">
<h2>Shownotes</h2>
<p>Unsere E-Mail für Fragen, Anregungen & Kommentare: <a href="mailto:[email protected]">[email protected]</a></p>
<h3>News aus der Szene</h3>
<ul>
<li>Bald startet der Kartenverkauf für die <a href="https://ep2020.europython.eu/">europython 2020</a></li>
<li><a href="https://docs.python.org/3/whatsnew/changelog.html">Python 3.8.2</a></li>
</ul>
<h3>Modul aus der Standardbibliothek</h3>
<ul>
<li><a href="https://docs.python.org/3/library/pathlib.html">Pathlib</a></li>
</ul>
<h3>Metathema</h3>
<ul>
<li><a href="https://www1.wdr.de/mediathek/audio/wdr5/wdr5-das-philosophische-radio/index.html">WDR 5 Das philosophische Radio</a></li>
</ul>
<h3>Volltextsuchmaschinen</h3>
<ul>
<li><a href="https://lucene.apache.org/core/">Lucene</a> - inzwischen die Standardbibliothek für Volltextsuche</li>
<li><a href="https://lucene.apache.org/solr/">Solr</a> - Ein auf Lucene aufsetzender Suchserver</li>
<li><a href="https://www.elastic.co/de/">Elasticsearch</a> - Ein ebenfalls auf Lucene aufsetzender Suchserver</li>
<li><a href="https://xapian.org/">xapian</a></li>
<li><a href="http://sphinxsearch.com/">Sphinx</a></li>
<li><a href="https://whoosh.readthedocs.io/en/latest/">whoosh</a> Volltextsuche in Python</li>
<li><a href="https://www.sqlite.org/fts5.html">FTS5</a> Volltextsucherweiterung für sqlite</li>
<li><a href="https://www.postgresql.org/docs/current/textsearch.html">Postgresql</a> Volltextfeature</li>
<li><a href="https://mariadb.com/kb/en/full-text-index-overview/">MariaDB</a> Volltextfeature</li>
<li><a href="https://github.com/zombodb/zombodb">zombodb</a></li>
<li><a href="https://nlp.stanford.edu/IR-book/html/htmledition/variable-byte-codes-1.html">Variable byte encoding</a></li>
<li><a href="https://trec.nist.gov/">TREC</a> Conference series</li>
<li><a href="https://en.wikipedia.org/wiki/Okapi_BM25">BM25 / Okapi</a></li>
<li><a href="https://en.wikipedia.org/wiki/PageRank">PageRank</a></li>
<li><a href="https://github.com/RediSearch/RediSearch">RediSearch</a> Volltexterweiterung für redis</li>
<li><a href="https://en.wikipedia.org/wiki/Learning_to_rank">Learning to rank</a></li>
<li><a href="https://en.wikipedia.org/wiki/Discounted_cumulative_gain">NDCG</a>, <a href="https://en.wikipedia.org/wiki/Evaluation_measures_(information_retrieval)#Mean_average_precision">MAP</a>, <a href="http://olivier.chapelle.cc/pub/err.pdf">ERR</a></li>
<li><a href="https://docs.djangoproject.com/en/3.0/ref/contrib/postgres/search/">Django Postgres full text search</a></li>
</ul>
<h3>Picks</h3>
<ul>
<li><a href="https://github.com/TheAlgorithms/Python">The Algorithms python</a></li>
<li>read json directly in python: <a href="https://t.co/VMM2AMyauD">Armin Ronacher's tweet</a></li>
</ul>
<h3>Python Entwicklungsumgebung Windows</h3>
<ul>
<li>Tutorial: <a href="https://github.com/oryon-dominik/dotfiles-den/blob/master/tutorials/python/python-with-pyenv-environment-on-windows.md">pyenv installation mit powershell</a></li>
</ul>
</section> </section> </div> </article>
Topics
pythonvolltextsuchefulltextsearchlucenesolrpostgres