标签:: 数据分析

Pagerank 实现文本摘要

pagerank 实现文本自动摘要一 分句 使用正则将文档按照标点符号或其它符号进行分句,成为列表形式。 二 分词,去掉停用词 使用jieba分词将列表中的每个句子分词,并去掉停用词。这一步,还有词的向量化 可使用sklearn中的CountVectorizer函数一并实现。 词的向量化和tf-idf TFIDF 是个什么鬼 TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一

K-Means基于RFM模型的客户分类

看到过基于LRFMC模型的航空客户分类,试试对我司的客户进行分类。 如何通过RFM模型,为用户分群,实现精细化运营 RFM模型是一个被广泛使用的客户关系分析模型,主要以用户行为来区分客户,RFM分别是:    R = Recency 最近一次消费    F = Frequency 消费频率 M = Monetary 消费金额 第一步:先挑出来近1个月的复购用户。 第二步:近1个月内复购用户

PEST分析方法(一)

PEST 分析模型 从事同城配送行业,感觉现在是王小二过年,心理慌啊,我还欠老马不少银子啊 看看这线条,跌宕起伏,犹如过山车叫人心惊肉跳。 耳闻PEST是卜卦大湿,据传卜过的人都说好。 一日登门请教! 我:“大湿啊,你看看我这,未来可好?”大湿低头端详片刻,悠悠道:“你这是季节性情感障碍综合征。”我:“情感障碍?”大湿:“对,你看啊,节假日,特别是大的传统节日,你心情好点,而且越来越差,