当前仓库属于关闭状态,部分功能使用受限,详情请查阅 仓库状态说明
1 Star 0 Fork 1

董志强 / p2p
关闭

forked from 李雪博 / p2p
关闭
 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
data_to_mongodb.py 1.64 KB
一键复制 编辑 原始数据 按行查看 历史
李雪博 提交于 2019-01-08 15:23 . '第一次提交'
# -*- coding: utf-8 -*-
from pymongo import MongoClient
import json
import csv
# 连接
conn = MongoClient('localhost', 27017)
# 连接数据库
db = conn.p2p
# 资讯类型
# 新闻入库
db.news.remove()
content = open('static/data/raw/news.json', 'r',encoding='utf-8',errors='ignore')
data = json.load(content)
db.news.insert(data)
print("now the number of news is:%d" % db.news.count())
# 政策入库
db.policy.remove()
data = json.load(open('static/data/raw/policy.json', 'r',encoding='utf-8',errors='ignore'))
db.policy.insert(data)
print("now the number of policy is:%d" % db.policy.count())
# 政策入库
db.opinion.remove()
data = json.load(open('static/data/raw/opinion.json', 'r',encoding='utf-8',errors='ignore'))
db.opinion.insert(data)
print("now the number of opinion is:%d" % db.opinion.count())
# 用户评论入库
db.ugc.remove()
data = csv.reader(open('static/data/raw/ugc.csv', 'r',encoding='utf-8',errors='ignore'))
for line in data:
if data.line_num == 1:
continue
item = dict()
item['_id'] = line[0]
item['item_type'] = line[1]
item['source'] = line[2]
item['url'] = line[3]
item['author'] = line[4]
item['title'] = line[5]
item['content'] = line[6]
item['item_pub_time'] = line[7]
item['tags'] = line[8]
item['cmt_cnt'] = line[9]
item['fav_cnt'] = line[10]
item['gmt_create'] = line[11]
item['exinfo1'] = line[12]
item['exinfo2'] = line[13]
db.ugc.insert(item)
print("now the number of ugc is:%d" % db.ugc.count())
# 初始用户
db.user.remove();
db.user.insert({'username': 'test', 'password': '123'})
print("now the number of user is:%d" % db.user.count())
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Python
1
https://gitee.com/dong_zhi_qiang/p2p.git
git@gitee.com:dong_zhi_qiang/p2p.git
dong_zhi_qiang
p2p
p2p
master

搜索帮助

344bd9b3 5694891 D2dac590 5694891