pyunit_newword package

Submodules

pyunit_newword.words module

class pyunit_newword.words.NewWords(max_split=5, filter_cond=None, filter_free=None)[source]

Bases: object

add_text(file, encoding='UTF-8')[source]

读取文本数据内容

统计:[关键字次数,关键字频率,关键字的左邻,关键字的右邻]

Parameters:
  • file – 文件文本路径
  • encoding – 文本格式
analysis_data()[source]

分析文本数据

分析:关键词每个片段凝固程度:solid

关键字的左邻自由程度:front_all

关键字的右邻自由程度:end_all

get_words()[source]

新词筛选

Module contents