V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  nlfiasel  ›  全部回复第 2 页 / 共 2 页
回复总数  27
1  2  
@overwall2016w 向量数据库不过是把别的类型的数据(比如文本)和向量关联起来,向量也是用外部的 embedding 模型计算的。另外所谓向量数据库,其实你维护一个(向量,你的数据)的 tuple list,然后每次都拿查询向量遍历计算,其实效果也差不多。然后这项目也就是推荐个起手的切入点,实际上你可能得根据自己的数据结构另起一套具体的实现。具体实现的话,AI 目前的形式就当成文本补全的 API 就行,langchain 用上的必要性其实也不是很高,因为这玩意针对 gpt 的优化比较多,对于国产的本地 llm 实际上自带的 prompts 效果也不太行。
不过你所谓的训练知识库一般实际上代指的可能是文本嵌入,将文本映射成向量。训练 llm 的话以你的设备可能有点困难。
8G 显存的话可以试试 4bit 量化的 7B 及以下的模型,比如 Mistral-7B 或 chatglm3-6b 之类的,具体哪些比较好可以去 huggingface 的 models 页上自己挑。
157 天前
回复了 shuiguomayi 创建的主题 Linux manjaro 滚挂之后排查问题的线索?
一般来说,先不用管 log ,不用 manjaro 所以不太清楚具体的操作。
对于 arch 的话,把原系统挂在到 mnt 上,然后参照安装指南( https://wiki.archlinuxcn.org/wiki/%E5%AE%89%E8%A3%85%E6%8C%87%E5%8D%97)走一部分(就是重新安装基础部分)
一般就,执行一下 pacstrap -K /mnt base linux linux-firmware 就行
另外 chroot 后 journalctl 看的是原系统的信息吧
159 天前
回复了 shuiguomayi 创建的主题 Linux Linux 上有什么好的备份工具?
restic +1
2023-01-23 21:59:53 +08:00
回复了 hawthornn 创建的主题 程序员 Linux 上使用 MPTCP 如何指定出站网卡?可有偿求教!
mptcp 有两个版本的,5.6 内核之后有个集成到内核的版本,官方页面上也有提示,里面有个 wiki 可以看看了解下思路。
另外你这个描述,入站是普通 tcp ,出站是 mptcp 分流挺让人疑惑的。入站和出站是完全没有关系的不同的连接嘛?
如果是这样子的话,然后出站目的地是个 mptcp 的 server 端,那么在集成到内核里的版本的逻辑应该就是添加 subflow 。
可以参照一下上面的 wiki 里面提到的示例: https://www.tessares.net/mptcp-proxy-setup-at-home-easier-now/

sudo ip mptcp limits set subflow 2
sudo ip mptcp endpoint add 192.168.10.2 dev usb0 subflow
sudo ip rule add from 192.168.10.2 table 42
sudo ip route add default via 192.168.10.1 table 42
1  2  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3100 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 16ms · UTC 11:45 · PVG 19:45 · LAX 04:45 · JFK 07:45
Developed with CodeLauncher
♥ Do have faith in what you're doing.