PLAY PODCASTS
Suchmaschinen

Suchmaschinen

Suchmaschinen

Python Podcast · Jochen Wersdörfer / Dominik Geldmacher

February 24, 20201h 36m

Show Notes

<article class="post-detail"> <header> <h2 class="post-title"> <a href="https://python-podcast.de/show/suchmaschinen/">Suchmaschinen</a> (click here to comment) </h2> <!-- link is on one line to avoid underlined whitespace --> <div class="post-card-meta"> <a href="https://python-podcast.de/show/suchmaschinen/"><time datetime="2020-02-25T00:00:00+01:00">25. Februar 2020</time>,</a> <span class="author">Jochen</span> </div> </header> <div class="post-body"> <section class="block-overview"> <section class="block-paragraph"> Heute ging es um Volltextsuchmaschinen.<br /> <br /> Wir sprechen dar&uuml;ber, was die so grunds&auml;tzlich tun und wie man sie von Python aus verwenden kann, oder auch selbst eine implementieren k&ouml;nnte. Weitere Themen waren die Relevanz von Suchergebnissen, SEO und alles M&ouml;gliche drumherum. Zudem haben wir unsere Androhung aus fr&uuml;heren Episoden wahr gemacht und sprechen ein wenig &uuml;ber das pathlib Modul aus der Standardbibliothek.<br /> <br /> </section> <section class="block-audio"> </section> <section class="block-paragraph"> <br /> <br /> </section> </section> <section class="block-detail"> <section class="block-paragraph"> <h2>Shownotes</h2> <p>Unsere E-Mail f&uuml;r Fragen, Anregungen &amp; Kommentare: <a href="mailto:[email protected]">[email protected]</a></p> <h3>News aus der Szene</h3> <ul> <li>Bald&nbsp;startet&nbsp;der Kartenverkauf f&uuml;r die <a href="https://ep2020.europython.eu/">europython 2020</a></li> <li><a href="https://docs.python.org/3/whatsnew/changelog.html">Python 3.8.2</a></li> </ul> <h3>Modul aus der Standardbibliothek</h3> <ul> <li><a href="https://docs.python.org/3/library/pathlib.html">Pathlib</a></li> </ul> <h3>Metathema</h3> <ul> <li><a href="https://www1.wdr.de/mediathek/audio/wdr5/wdr5-das-philosophische-radio/index.html">WDR 5 Das philosophische Radio</a></li> </ul> <h3>Volltextsuchmaschinen</h3> <ul> <li><a href="https://lucene.apache.org/core/">Lucene</a>&nbsp;- inzwischen die Standardbibliothek f&uuml;r Volltextsuche</li> <li><a href="https://lucene.apache.org/solr/">Solr</a>&nbsp;- Ein auf Lucene aufsetzender Suchserver</li> <li><a href="https://www.elastic.co/de/">Elasticsearch</a>&nbsp;- Ein ebenfalls auf Lucene aufsetzender Suchserver</li> <li><a href="https://xapian.org/">xapian</a></li> <li><a href="http://sphinxsearch.com/">Sphinx</a></li> <li><a href="https://whoosh.readthedocs.io/en/latest/">whoosh</a>&nbsp;Volltextsuche in Python</li> <li><a href="https://www.sqlite.org/fts5.html">FTS5</a>&nbsp;Volltextsucherweiterung f&uuml;r sqlite</li> <li><a href="https://www.postgresql.org/docs/current/textsearch.html">Postgresql</a>&nbsp;Volltextfeature</li> <li><a href="https://mariadb.com/kb/en/full-text-index-overview/">MariaDB</a>&nbsp;Volltextfeature</li> <li><a href="https://github.com/zombodb/zombodb">zombodb</a></li> <li><a href="https://nlp.stanford.edu/IR-book/html/htmledition/variable-byte-codes-1.html">Variable byte encoding</a></li> <li><a href="https://trec.nist.gov/">TREC</a>&nbsp;Conference series</li> <li><a href="https://en.wikipedia.org/wiki/Okapi_BM25">BM25 / Okapi</a></li> <li><a href="https://en.wikipedia.org/wiki/PageRank">PageRank</a></li> <li><a href="https://github.com/RediSearch/RediSearch">RediSearch</a>&nbsp;Volltexterweiterung f&uuml;r redis</li> <li><a href="https://en.wikipedia.org/wiki/Learning_to_rank">Learning to rank</a></li> <li><a href="https://en.wikipedia.org/wiki/Discounted_cumulative_gain">NDCG</a>,&nbsp;<a href="https://en.wikipedia.org/wiki/Evaluation_measures_(information_retrieval)#Mean_average_precision">MAP</a>,&nbsp;<a href="http://olivier.chapelle.cc/pub/err.pdf">ERR</a></li> <li><a href="https://docs.djangoproject.com/en/3.0/ref/contrib/postgres/search/">Django Postgres full text search</a></li> </ul> <h3>Picks</h3> <ul> <li><a href="https://github.com/TheAlgorithms/Python">The Algorithms python</a></li> <li>read json directly in python: <a href="https://t.co/VMM2AMyauD">Armin Ronacher&#39;s tweet</a></li> </ul> <h3>Python Entwicklungsumgebung Windows</h3> <ul> <li>Tutorial: <a href="https://github.com/oryon-dominik/dotfiles-den/blob/master/tutorials/python/python-with-pyenv-environment-on-windows.md">pyenv installation mit powershell</a></li> </ul> </section> </section> </div> </article>

Topics

pythonvolltextsuchefulltextsearchlucenesolrpostgres