V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  oisc  ›  全部回复第 6 页 / 共 30 页
回复总数  597
1 ... 2  3  4  5  6  7  8  9  10  11 ... 30  
2019-03-17 22:18:04 +08:00
回复了 lazydog 创建的主题 问与答 如何才能提高一个人的眼界,或者说格局?
推荐一本书《随机漫步的傻瓜》
2019-03-16 15:39:06 +08:00
回复了 GPLer 创建的主题 奇思妙想 怎样快速区分机器翻译和人工翻译?
找有歧义的句子,找需要常识推理才能翻译的句子
2019-03-09 16:10:28 +08:00
回复了 luolufang 创建的主题 宽带症候群 ipv6 感觉没啥用
如果不做中文的,其实已经有现成的数据集可以用了,https://github.com/KaiDMML/FakeNewsNet
自然语言处理很多工作其实都是对语料的处理和特征工程,机器学习算法也是依赖特征的。
1. 我建议你先从平衡语料的构建开始,可以分几个主题比如关于医学、新闻等每个主题去收集一些正负样例,样例的正负比例尽量均衡。每个样例标注上所属的主题类别、是否是假新闻、来源、时间等。然后把你构建的语料进行划分,可以划分为训练集和测试集,也可以留一部分做开发集,如果你不想用交叉验证的话。

2. 对你构建的语料库进行预处理,包括分词、词性标注等

3. 基于一个有监督的机器学习算法完成模型的训练和性能评价,比如最简单的先用 ngram、tfidf,lda 等方法提取离散特征,然后用 SVM 分类,或者用现在比较流行的 LSTM CNN4text 等模型。
等你熟悉流程和数据之后,就可以从数据上做一些文章,看哪些方面可以改进的。
2019-03-08 16:19:14 +08:00
回复了 MINYAN 创建的主题 优惠信息 用中国移动的各位大佬看过来,可以换套餐了--移动花卡
还要一次性冻结一年的套餐费的花呗额度???花呗账单延后还要自己亲自每个月去点???

望周知,这不是开套餐,这是开了个爹。
2019-03-08 16:14:48 +08:00
回复了 MINYAN 创建的主题 优惠信息 用中国移动的各位大佬看过来,可以换套餐了--移动花卡
50G 流量只有 20G 通用流量 ??? 300 分钟通话还要每天签到 ??? 这还推广价还要 48 ?
lg gram 重量、续航都 ok
2019-02-26 12:12:01 +08:00
回复了 2333zzz 创建的主题 优惠信息 联想 thinkplus 口红电源 149 元上市新低
没有 QC 4.0,只支持 QC 3.0
2019-02-26 11:56:51 +08:00
回复了 oisc 创建的主题 分享发现 没有人关注一下 Hololens 2 ?
@emeab 应该是吸取了 Kinect 教训,把没有多少应用,不成熟但是技术先进的产品过早推给普通消费市场也不会被接受。
2019-02-25 13:21:11 +08:00
回复了 oisc 创建的主题 分享发现 没有人关注一下 Hololens 2 ?
@daizongxyz mate x 1.75w ,我看关注的挺热啊
@ccming 准确说是中日韩胃癌发病率非常高。美国不鼓励公民进行胃癌早期筛选是因为胃癌在美国发病率不高,不过日本鼓励早期胃癌筛选。
心疼楼主,部分楼层连概率都搞不清楚,就开始扯基因和宿命了,不是说规避这些就不患癌,而是能从统计意义上降低患癌人群的概率。我来补充一些:少吃精米,少吃深加工、超加工食品,坚持每年做至少一次早期癌症筛选。最近中医肝损的论文大家不去了解一下吗?
1 ... 2  3  4  5  6  7  8  9  10  11 ... 30  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   956 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 21:31 · PVG 05:31 · LAX 13:31 · JFK 16:31
Developed with CodeLauncher
♥ Do have faith in what you're doing.