zhuzhaodan
发表于 2015-8-10 14:57:19
seanhere 发表于 2015-8-2 17:40
可以用数据库存放内容啊,我刚开始用文档存放内容,文档的修改和删除都非常麻烦,删除一百万文章都要几个 ...
数据库存内容,体积会小很多倍吗?我近期准备上个几百万页面的站点,但是不知道是直接放html页面还是存mysql,毕竟存数据库里面那就要查询数据库开销不小
seanhere
发表于 2015-8-10 16:40:03
zhuzhaodan 发表于 2015-8-10 14:57
数据库存内容,体积会小很多倍吗?我近期准备上个几百万页面的站点,但是不知道是直接放html页面还是存my ...
之前用文件存放数据,大约每篇文章3-5KB,百万文章要近4GB,MySQL存放大约百万文章1GB, MongoDB大约百万文章2GB,空间占用不是问题,我遇到的问题是 Linux下一个文件夹下放了几百万个html文件,删除起来非常非常慢,而数据库操作管理就非常方便
zhuzhaodan
发表于 2015-8-11 00:00:20
seanhere 发表于 2015-8-10 16:40
之前用文件存放数据,大约每篇文章3-5KB,百万文章要近4GB,MySQL存放大约百万文章1GB, MongoDB大约百万 ...
你的几百万文章,是怎么伪原创呢
seanhere
发表于 2015-8-11 10:57:39
zhuzhaodan 发表于 2015-8-11 00:00
你的几百万文章,是怎么伪原创呢
YOO版主的方法
uuivw
发表于 2015-8-11 16:38:11
内容是王啊:lol:lol:lol
不认识
发表于 2015-8-15 18:05:57
seanhere 发表于 2015-8-10 16:40
之前用文件存放数据,大约每篇文章3-5KB,百万文章要近4GB,MySQL存放大约百万文章1GB, MongoDB大约百万 ...
:'(好厉害,都是写程序的!
zhuzhaodan
发表于 2015-8-24 01:06:21
请问下你这些随机句子,单独的句子要做处理么,就是句子再做一下spin,再随机组合spin过后的句子,我现在弄了几亿条句子,想按照句子的意思相似度组合一下,再组合成文章,最小的单元是句子,现在发愁句子需要作处理吗,作处理的话工作量又加大了。。。
chazoon
发表于 2016-12-3 09:05:08
seanhere 发表于 2015-8-10 16:40
之前用文件存放数据,大约每篇文章3-5KB,百万文章要近4GB,MySQL存放大约百万文章1GB, MongoDB大约百万 ...
删除还怕难吗? cd进要删除的目录,rm -rf * 秒删
tufei1314
发表于 2018-2-20 11:38:54
哇怎么生成呀