diff --git a/stopwords.txt b/stopwords.txt new file mode 100644 index 0000000..0c9821b --- /dev/null +++ b/stopwords.txt @@ -0,0 +1,28 @@ +"的", "一", "不", "在", "人", "有", "是", "为", "以", "于", "上", "下", "他", "我", "你", + "也", "和", "及", "与", "了", "之", "来", "去", "大", "小", "多", "少", "部", "分", "个", + "件", "条", "只", "本", "篇", "张", "次", "回", "年", "月", "日", "时", "分", "秒", + "这里", "那里", "哪里", "什么", "怎么", "为什么", "谁", "哪", "几", "每", "各", "自己", + "别人", "大家", "我们", "你们", "他们", "她们", "它们", "这", "那", "其", "此", "彼", + "且", "并", "而", "或", "若", "因", "果", "但", "却", "虽", "然", "既", "又", "还", + "就", "才", "都", "只", "总", "曾", "已", "将", "要", "会", "能", "可", "应", "该", + "须", "需", "得", "过", "着", "了", "的", "地", "得", "着", "啊", "呀", "呢", "吧", + "吗", "么", "啦", "呗", "喽", "呵", "哦", "唉", "咦", "哼", "嗯", "嗬", "哒", "哟", + "通过", "对于", "关于", "由于", "按照", "根据", "基于", "随着", "伴随", "包括", "包含", + "例如", "比如", "诸如", "等等", "及其他", "以及", "还有", "另外", "此外", "同时", "并且", + "或者", "要么", "不仅", "而且", "不但", "还", "甚至", "更", "越", "愈", "最", "极", "很", + "非常", "特别", "十分", "相当", "比较", "略微", "稍微", "几乎", "将近", "大约", "大概", + "可能", "也许", "或许", "恐怕", "应该", "应当", "必须", "一定", "肯定", "必然", "偶然", + "突然", "忽然", "渐渐", "逐渐", "慢慢", "悄悄", "默默", "暗暗", "公然", "公开", "私下", + "亲自", "亲自", "特地", "特意", "专门", "顺便", "趁便", "随手", "随口", "随意", "任意", + # 英文停用词 + "a", "an", "the", "and", "or", "but", "so", "for", "of", "in", "on", "at", "to", "by", "with", + "about", "against", "between", "into", "through", "during", "before", "after", "above", "below", + "from", "up", "down", "out", "off", "over", "under", "again", "further", "then", "once", + "here", "there", "when", "where", "why", "how", "all", "any", "both", "each", "few", "more", + "most", "other", "some", "such", "no", "nor", "not", "only", "own", "same", "so", "than", "too", + "very", "s", "t", "can", "will", "just", "don", "should", "now", "d", "ll", "m", "o", "re", + "ve", "y", "ain", "aren", "couldn", "didn", "doesn", "hadn", "hasn", "haven", "isn", + "ma", "mightn", "mustn", "needn", "shan", "shouldn", "wasn", "weren", "won", "wouldn", + "i", "me", "my", "myself", "we", "our", "ours", "ourselves", "you", "your", "yours", + "yourself", "yourselves", "he", "him", "his", "himself", "she", "her", "hers", "herself", + "it", "its", "itself", "they", "them", "their", "theirs", "themselves" \ No newline at end of file