@h9h/word-collect
v1.0.7
Published
Small library to collect words, optionally using a stemmer
Downloads
6
Readme
word-collect
Simple Library to collect word-sets, optionally using stemming algorithms
Usage
const { collectWords } = require('../src/collector')
const text = '...'
const result = collectWords('de', text)
console.log(result.getWordDistribution(3))
Example
Mephistopheles:
Ein Teil von jener Kraft, Die stets das Böse will und stets das Gute schafft.
Faust:
Was ist mit diesem Rätselwort gemeint?
Mephistopheles:
Ich bin der Geist, der stets verneint! Und das mit Recht; denn alles, was entsteht, Ist wert, daß es zugrunde geht; Drum besser wär's, daß nichts entstünde. So ist denn alles, was ihr Sünde, Zerstörung, kurz, das Böse nennt, Mein eigentliches Element.
Faust:
Du nennst dich einen Teil, und stehst doch ganz vor mir?
Result:
Array(1)
Array(2)
0 = "stets" // Word
1 = 3 // Count
@h9h/word-collect
word-collect module
Given a text, this modules offers methods to
- break the text into words
- removes stop-words (aka noise)
- stemm those words (reduzing them to their base form)
- and counting the occurrences of these stemms
The result is a distribution of the main words in this text, giving a quick overview what it's all about.