1 Star 0 Fork 7

邓飞骏 / Python练习

forked from SHTLLS / Python练习 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
4-6商品关键词权重分析.py 1.87 KB
一键复制 编辑 原始数据 按行查看 历史
SHTLLS 提交于 2020-11-26 14:08 . '格式'
# 任务详情
# 请使用杭州大牌女装.txt文本完成提取文本中权重最高的5个关键词的任务。
# 任务要求
# 1. 程序以数组的形式返回五个关键词,关键词类型是str
# 2. 使用结巴库内置的TextRank 算法抽取关键词,只返回关键词,不必返回权重。关键词的词性必须是名词和动词
# 3. 返回的5个关键词至少要有4个关键词与系统内置的答案一致
# 4. 返回关键词不需要考虑顺序
# 5. 杭州大牌女装.txt使用requests库读取,UTF-8编码,链接在下方给出
# 6. Jieba库词性表.xlsx也在下方给出,作为参考
# 测试用例
# 输入:无
# 输出:['印花' ,'关键词2','关键词3','关键词4','关键词5']
#
#
# jiba词性表说明:http://72.itmc.org.cn:80/JS001/static/data/python/3030/77/fj_Jieba词性表及说明.xlsx
# 杭州大牌女装:http://72.itmc.org.cn:80/JS001/static/data/python/3030/77/fj_5392_hangzhou_top_woman_wear.txt
#
# # 1.运行或提交代码不需要自己编写测试用例,后台自动进行测试检查。
# 2.您编写代码的区域可以不限定在类或者函数体内,保证输入与输出符合任务要求即可。
# 3.点击“运行代码”按钮,可以查看程序设计是否正确,运行次数越多,任务得分越低。
# 4.点击“提交代码”按钮,系统将保存代码,并记录任务数据。
# 5.点击右上方“结束任务”按钮,系统将在后台计算任务得分,任务结束。
# -*- coding: utf-8 -*-
import requests
import jieba.analyse
class Solution:
def itemAnalyse(self) -> list:
url = "http://72.itmc.org.cn:80/JS001/static/data/python/3030/77/fj_5392_hangzhou_top_woman_wear.txt"
res = requests.get(url)
res.encoding = 'utf-8'
return jieba.analyse.textrank(res.text, allowPOS=['n', 'v'], topK=5)
print(Solution.itemAnalyse(Solution))
Python
1
https://gitee.com/obsery/python-exercises.git
git@gitee.com:obsery/python-exercises.git
obsery
python-exercises
Python练习
master

搜索帮助

53164aa7 5694891 3bd8fe86 5694891