Recently Published

Консенсусное дерево советских авторов (современников Шолохова)
Допустим, в нашем научном поле поставили острый вопрос авторства (например: правда ли автором "Тихого Дона" является Шолохов, а не, скажем, Фадеев?). Одним из методов, способных помочь нам ответить на этот вопрос является иерархическая кластеризация и её визуализация через консенсусные деревья. В домашнем задании предлагалось скачать файл со стилометрическими данными "Тихого Дона" и романов других авторов, современников Шолохова, дабы проверить высказанную выше гипотезу с точки зрения стилометрии.
Hand On Mg3 Wasis
Tugas Hand On Mg3
Project-Data Science Presentations
Complete 5-Slide R Presentation for SwiftKey Capstone
Project-Data Science Capstone
This report presents an exploratory analysis of the three text data sets provided for the SwiftKey Capstone Project: blogs, news, and Twitter. The goal is to understand the basic characteristics of these data sets before building a next-word prediction algorithm. Key findings include: The Twitter data set has the most lines (over 2 million) but the smallest file size The blogs data set contains the longest individual lines (over 40,000 characters) Word "love" appears about 4 times more frequently than "hate" in Twitter data All three data sets show similar patterns in word frequency distributions
Analisis dan Visualisasi Diamonds
Visualisasi ini menggunakan data yang bersumber dari R, yaitu dataset diamonds, yang memuat informasi tentang cut, color, clarity, dan atribut lain dari berlian tersebut.
Linh Le - DV Lab HW 6
HTML