Data analysis and machine learning – Udacity thoughts

Lesson no 3 is about data analysis.  If you were able to collect data and prepare it it’s time to draw conclusions.  How to use datasets? How to predict the future? This is what I hoped to learn now..

Czytaj dalej Data analysis and machine learning – Udacity thoughts

Porównanie tekstu, scikit-learn i nltk (NLP)

Skaut będzie porównywać teksty. Jak to jest możliwe? Najpierw trzeba tekst zamienić na ciąg liczb – wektor który będzie porównywalny.  W tym celu będziemy chcieli wysupłać z tekstu jego właściwości.  Odczytać zmienne które opiszą ten tekst.  Do tego posłużą nam niezastąpione biblioteki od Pythona do obsługi tekstu nltk oraz nauki maszynowej scikit-learn aka sklearn.

Czytaj dalej Porównanie tekstu, scikit-learn i nltk (NLP)