PLAY PODCASTS
Marko Plahuta o analizah slovenskega koščka Twitterja in Mastodonu

Marko Plahuta o analizah slovenskega koščka Twitterja in Mastodonu

Odbita do bita · RTVSLO – Val 202

November 24, 202233m 15s

Audio is streamed directly from the publisher (dts.podtrac.com) as published in their RSS feed. Play Podcasts does not host this file. Rights-holders can request removal through the copyright & takedown page.

Show Notes

Twitter zaradi prevzema Elona Muska izgublja uporabnike in prešteva kritike strokovnjakov, zaposlenih in tviterašev. Kakšno je razpoloženje na slovenskem delu Twitterja, koliko uporabnikov še tvita v slovenščini, o čem govorijo in kako natančno lahko na podlagi Twitterja napovemo volilne rezultate? Omrežju Mastodon, ki velja za alternativo Twitterju, se je do sredine novembra pridružilo milijon uporabnikov, število narašča, povprečje dnevnih uporabnikov se povečuje.<!DOCTYPE html> <html> <head> </head> <body> <p><strong>Marko Plahuta</strong> je programer, ki se ukvarja s strojnim učenjem na področju obdelave jezika. Z raziskovanjem in vizualizacijo se ukvarja v prostem času.</p> <h3>Zapiski: </h3> <ul> <li><a href="http://virostatiq.com/about/">About the author - Virostatiq</a></li> <li><a href="https://www.cjvt.si/">CENTER ZA JEZIKOVNE VIRE IN TEHNOLOGIJE</a></li> <li><a href="https://kinoteka.si/filmski-pojmovnik/">Filmski pojmovnik – Slovenska kinoteka</a></li> <li><a href="https://app.sli.do/event/5TtrcS9MAFVnhMUwrCGFvX/embed/polls/7293a229-2405-4ed3-881c-24156e77e30a">Kviz!</a></li> </ul> <p>Kaj Marko uporablja:</p> <ul> <li><a href="https://www.elastic.co/">Elastic Search za shranjevanje, iskanje in preproste agregacije</a></li> <li><a href="https://developer.twitter.com/">Twitterjev API za zajemanje podatkov s Twitterja</a></li> <li><a href="https://huggingface.co/models">Naučene jezikovne modele, dostopne na HuggingFace, kot osnovo za klasifikatorje in generativne modele</a></li> <li>To zgoraj skupaj s knjižnicami <a href="https://www.tensorflow.org/">TensorFlow</a>/<a href="https://keras.io/">Keras</a> in <a href="https://pytorch.org/">PyTorch</a></li> <li><a href="https://spacy.io/">spaCy, ki je nedavno izšel za slovenščino</a></li> <li><a href="https://github.com/clarinsi/classla">Classla, ki je podoben spaCyju, a temelji na Stanfordovi tehnologiji</a></li> <li>Starejše jezikovne tehnologije, zbrane v knjižnicah <a href="https://radimrehurek.com/gensim/">Gensim</a> in <a href="https://scikit-learn.org/stable/">Scikit-Learn</a></li> <li><a href="https://umap-learn.readthedocs.io/en/latest/">UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction — umap 0.5 documentation</a></li> <li><a href="https://github.com/facebookresearch/faiss">GitHub - facebookresearch/faiss: A library for efficient similarity search and clustering of dense vectors.</a></li> <li><a href="https://hdbscan.readthedocs.io/en/latest/index.html">The hdbscan Clustering Library — hdbscan 0.8.1 documentation</a></li> <li><a href="https://github.com/eliorc/node2vec">GitHub - eliorc/node2vec: Implementation of the node2vec algorithm.</a></li> </ul> <p>Zanimivosti iz tehnološkega sveta pošiljava tudi v elektronske nabiralnike. Naročilnica na Odbito pismo je <a href="https://landing.mailerlite.com/webforms/landing/i3c2w7?fbclid=IwAR0THDjgpxnpKid4_t2xsMsxUUSajEAm9Lk_qglmeuqsxfSwTTP24sZgSKs">tukaj</a>. Razpravi o odbitih temah se lahko pridružite na <a href="https://www.twitter.com/odbita">Twitterju</a>. Dosegljiva sva tudi na naslovu: <a href="mailto:[email protected]">[email protected]</a>. </p> <p>Podkast Odbita do bita je brezplačno na voljo v vseh aplikacijah za podkaste. Naročite se in podkast ocenite. </p> </body> </html>