V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
yandy
V2EX  ›  分享创造

微搜索—专注提供站内搜索服务

  •  
  •   yandy ·
    yandy · 2014-09-22 15:48:21 +08:00 · 8512 次点击
    这是一个创建于 3518 天前的主题,其中的信息可能已经有所发展或是发生改变。

    微搜索是什么

    大家建站的时候,到了搜索这一步,会不会很头疼呢?

    做站内搜索的时候,可以使用 Google 或百度的站内搜索,或者干脆自己写(自己搭)。但是 Google 和百度的体验显然不大好,自己写又很麻烦(要学习,要优化还要运维),这时候使用第三方的搜索引擎就很方便了。

    微搜索是托管的服务。最少只需要3步,就可以给自己的网站添加上搜索功能了:

    1. 创建搜索引擎
    2. 添加域名
    3. 安装

    嗯,是不是很简单?

    微搜索还有什么

    除此之外,微搜索还提供基于 API 的高级用法(包括索引,搜索,分析统计等)与可视化的数据分析界面。

    主要特性有:

    • 全文搜索,实时索引(包括对中文的优化)
    • 即输即搜,自动补全
    • 搜索分析与可视化
    • 快速,稳定,弹性

    详细请参见微搜索特性

    为什么要做微搜索

    我们是一个不大的团队,目前只有八个人。现在的每个人都是程序员,连行政都会参与coding。因此,我们创业的理念就是:让开发者的工作更简单!

    在之前的项目中,我们都碰到了"要提供搜索功能"的问题,用过 ElasticSearch。直到我们渐渐意识到,像这样的工作,就跟"服务监控","长连接推送","发邮件"等等一样,如果能有专门的团队提供服务,由他们去调试,去优化,去运维,而我们只要专注自己的产品核心的开发,该是一件多么有意义的事情。

    于是就这样,我们开始了"微搜索"这样一个项目。

    欢迎试用

    目前微搜索还处于内测阶段,需要注册码才能注册试用。想体验的朋友可以使用如下注册码:

    53e5864d316361008c010000

    招贤纳士

    此外,如果你对我们团队,对我们做的事情感兴趣,欢迎联系我们。

    我们长期 招募靠谱开发者

    同时我们也 招募美少女

    第 1 条附言  ·  2014-09-22 16:21:14 +08:00
    ### 已有案例:

    * [暴走日报](http://baozouribao.com/)
    * [Teahour](http://teahour.fm/)

    欢迎体验
    17 条回复    2017-02-10 11:35:18 +08:00
    mornlight
        1
    mornlight  
       2014-09-22 16:01:16 +08:00
    如果网站只对内开放,需要账号才能浏览页面,你们有解决方案么
    yandy
        2
    yandy  
    OP
       2014-09-22 16:13:28 +08:00
    @mornlight 是否可以只有帐号,才能看到搜索框?或者通过 API 进行
    yandy
        3
    yandy  
    OP
       2014-09-22 16:20:48 +08:00
    ### 已有案例:

    * [暴走日报](http://baozouribao.com/)
    * [Teahour](http://teahour.fm/)

    欢迎体验
    binux
        4
    binux  
       2014-09-22 16:28:55 +08:00
    用拼音搜索,zidingyi 可以,zidingyisou 就不可以了
    yandy
        5
    yandy  
    OP
       2014-09-22 16:34:20 +08:00
    @binux 恩,这个和目前的拼音策略有关系,可以改进的。例如 zidingyi sou 是有的
    mornlight
        6
    mornlight  
       2014-09-22 16:42:28 +08:00
    @yandy 必须有账号才能搜索,所有内容都是对内。我刚才注册了一个,看起来你们是用爬虫自己去爬页面的。需要怎样的API?
    yandy
        7
    yandy  
    OP
       2014-09-22 17:06:18 +08:00
    @mornlight 是这样的,搜索的流程简单来说分为两部分:索引和搜索。所谓索引,就是将需要被搜索的内容push到搜索引擎。
    我们有两种方式实现索引:
    * [索引 API](http://doc.tinysou.com/v1/overview.html): 可以通过 API,主动地将需要搜索的内容 push 给我们。使用这种方式,可以建立自己的文档结构。
    * 爬虫: 如果不想通过 API 的方式,又有一个站点。那么可以依赖我们的爬虫去抓取。爬虫的本质也是 download 你的网页,抽取信息,通过"索引 API" push 给搜索引擎。
    mornlight
        8
    mornlight  
       2014-09-22 17:20:03 +08:00   ❤️ 1
    @yandy 明白了,大致是用户发表一个新帖子的时候,服务器就主动把帖子标题、内容等都push到你们那边。这样也可以。
    simapple
        9
    simapple  
       2014-09-22 17:56:39 +08:00
    用现成的不是sphinx或者其他的组件不是更简单,这个产品的优势是更加准确的语义分词? 还是足够庞大的机器学习 分词能力?
    jingwentian
        10
    jingwentian  
       2014-09-22 18:19:26 +08:00 via Android
    v2支持markdown了么,原文中的链接怎么发布的
    yandy
        11
    yandy  
    OP
       2014-09-22 18:22:32 +08:00
    @simapple 这样的,从功能上讲我们专注做搜索,无论是学习数据还是开发精力,我们肯定比自己搭要投入得多的多,这也就意味着我们的服务更有可能比自建搜索引擎来得准确、智能。其次我们提供的是服务型的产品,还有成本和运维上的意义。
    yandy
        12
    yandy  
    OP
       2014-09-22 18:24:16 +08:00
    @jingwentian 在发布的时候,右下角有个选项,得选择一下 markdown。不过坑爹的是,只有发布的时候可选,之后就没办法支持了。。。(见附言)
    laomo
        13
    laomo  
       2014-09-22 19:35:18 +08:00
    不错,和 Swiftype 很像
    https://swiftype.com/
    wgqzlj
        14
    wgqzlj  
       2014-09-23 13:42:45 +08:00
    阿里云也有类似的了 http://www.aliyun.com/product/opensearch
    yandy
        15
    yandy  
    OP
       2014-09-23 16:24:55 +08:00
    @wgqzlj 恩,阿里云的产品线很长,覆盖 ucloud, 又拍云,七牛,BAE,监控宝 等所有产品。。。。
    yandy
        16
    yandy  
    OP
       2014-09-29 01:11:43 +08:00
    注册码有更新了~ `c5b8f5e67291`
    kwklover
        17
    kwklover  
       2017-02-10 11:35:18 +08:00
    一直有关注,可惜网站已经打不开了,其实做云模式的站内搜索并不容易,数据结构,同步,数据量,搜索量,内外网,有特殊权限架构情况如何解决?

    所以我们一直致力于私有化部署的站内搜索产品--搜易站内搜索引擎,就是希望点点鼠标就能够配置好,完全无法写代码,当然也有局限性,比如无法部署到 LINUX 上。

    目前也有很多开源的产品,比如 ES , sphinx ,但是这些都需要有一定的安装门槛和开发能力才能搞定。有技术力量的话,当然是首选方案。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3350 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 11:42 · PVG 19:42 · LAX 04:42 · JFK 07:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.