RPubs

by RStudio

Recently Published

Консенсусное дерево советских авторов (современников Шолохова)

Допустим, в нашем научном поле поставили острый вопрос авторства (например: правда ли автором "Тихого Дона" является Шолохов, а не, скажем, Фадеев?). Одним из методов, способных помочь нам ответить на этот вопрос является иерархическая кластеризация и её визуализация через консенсусные деревья. В домашнем задании предлагалось скачать файл со стилометрическими данными "Тихого Дона" и романов других авторов, современников Шолохова, дабы проверить высказанную выше гипотезу с точки зрения стилометрии.

about 2 months ago

Tugas Mandiri Anreg Hands On Mg 3 (Novalina Septiani)

By novaaja

about 2 months ago

Hand On Mg3 Wasis

By ayaawasis

Tugas Hand On Mg3

about 2 months ago

Project-Data Science Presentations

By DeepakVarshney

Complete 5-Slide R Presentation for SwiftKey Capstone

about 2 months ago

Project-Data Science Capstone

By DeepakVarshney

This report presents an exploratory analysis of the three text data sets provided for the SwiftKey Capstone Project: blogs, news, and Twitter. The goal is to understand the basic characteristics of these data sets before building a next-word prediction algorithm. Key findings include: The Twitter data set has the most lines (over 2 million) but the smallest file size The blogs data set contains the longest individual lines (over 40,000 characters) Word "love" appears about 4 times more frequently than "hate" in Twitter data All three data sets show similar patterns in word frequency distributions

about 2 months ago