V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Braisdom  ›  全部回复第 14 页 / 共 31 页
回复总数  612
1 ... 10  11  12  13  14  15  16  17  18  19 ... 31  
2023-05-15 22:53:10 +08:00
回复了 Braisdom 创建的主题 程序员 智能 SQL 分析系统(我的新作品)
@leeg810312 不好意思有一点,是我理解错了。

您的观点是通过 SQL 去计算的效率,还是不如自已写程序计算(例如:Spark/Flink )的效率高。

复杂 SQL 是更难写呢?还是更难优化呢?这是两个不同的概念,SQL 优化本身有自身的规则,不同的 SQL 引擎会有一些区别,但本质上还是有规律的。
2023-05-15 22:39:52 +08:00
回复了 Braisdom 创建的主题 程序员 智能 SQL 分析系统(我的新作品)
@leeg810312 还有一点补充一下:

1 )快速响应需求变化在传统 BI 中有两种方法:1 )设计中间表,成本非常昂贵,基本以周为单位,2 )在 BI 中增加复杂 SQL ,基本以天为单位。但在 Agile Query 中,是以秒为单位的,已经将成本降至最低了,代价也已经是最低的了。
2023-05-15 22:33:09 +08:00
回复了 Braisdom 创建的主题 程序员 智能 SQL 分析系统(我的新作品)
@leeg810312
您的回答非常专业,我分别回答一下:

1 )根据查询的数据设计中间表:Agile Query 屏蔽的是为了简化查询而设计的中间表,如果纯粹的基于海量数据的优化,我们无法避免。

2 )物化视图:它本身不是为了节约性能,更重要的是降低开发成本。

3 ) SQL:Agile Query 会依据不同的 SQL 执行引擎进行特殊的优化,理论上人能够优化的 SQL ,Agile Query 都可能设计规则进行优化。


Agile Query 内的所有维度和指标可以进行自由的组合,不需要做任何其它工作,单纯这块就可以提升需求响应速度很多倍,传统 BI 中,不同维度的组合都需要设计中间表,如果纯粹写 SQL ,也是非常复杂的。

如果您有兴趣,我可以给你在线演示一下系统,您也可以在线挑战。
2023-05-15 18:40:49 +08:00
回复了 Braisdom 创建的主题 程序员 智能 SQL 分析系统(我的新作品)
@leeg810312

Agile Query 主要解决的是复杂 SQL 编程的问题,让数据系统不需要针对业务场景进行复杂的抽象过程,不再出现,同样计算公式计算的结果按不同维度存储在不同的表中,减少数据不一致产生的问题。

提升数据系统能够快速响应需求变化的能力
2023-05-15 18:32:30 +08:00
回复了 Braisdom 创建的主题 程序员 智能 SQL 分析系统(我的新作品)
@leeg810312
首先,您说的我部分同意,分层设计是为了解决海量数据计算和 SQL 复杂度,这两点都是 BI 比较痛的点。

目前复杂 SQL 可以通过 Agile Query 来实现,优化工作来就是 Agile Query 算法要解决的核心问题之一,会一直持续下。当然有了 Agile Query 也不能完全不做分层,针对海量数据,可以通过物化视图的方法实现,但相比传统所谓的数据集市要抽象得多,不需要基于场景去设计数据。当然也不需要额外的计算层去处理,也不会需要 Spark 这种低效率的计算工具。

难道这不是一种进步吗?
2023-05-15 17:02:45 +08:00
回复了 Braisdom 创建的主题 程序员 智能 SQL 分析系统(我的新作品)
@leeg810312

首先,ODS ,DW ,ADS ,宽表,数据血缘,数据集市等, 这些概念本身就是受限技术才衍生出来,本来就不应该存在。

抽象出各种层次的封装就是为了降低 SQL 的复杂度,因为写好复杂 SQL 的人太少了,维护成本极高。

现在数据的计算性能已经非常高了,为什么还要做那些层次的抽象,复杂的 SQL 也不需要写了,这难道不香吗?
2023-05-15 11:54:50 +08:00
回复了 Braisdom 创建的主题 程序员 智能 SQL 分析系统(我的新作品)
@Chad0000 是的,如果把所有复杂场景整理清楚,基本上编译器也设计出来了,

编译过程只需要 1 毫秒不到,用 GPT-4 不知道要多长时间了。一个查询可能也只要几秒钟
2023-05-15 11:35:18 +08:00
回复了 Braisdom 创建的主题 程序员 智能 SQL 分析系统(我的新作品)
@Chad0000 我们 2018 年的时候就研究通过机器学习生成 SQL ,但过于复杂的 SQL ,AI 搞起来还是非常有限的,编译规则过度复杂。
2023-05-15 11:27:16 +08:00
回复了 Braisdom 创建的主题 程序员 智能 SQL 分析系统(我的新作品)
@stardustree 我们有一系列的高级分析函数支持各种复杂分析。
2023-05-15 11:26:12 +08:00
回复了 Braisdom 创建的主题 程序员 智能 SQL 分析系统(我的新作品)
@stardustree 这些是比较基础的分析,完全支持,还有更多更复杂的分析。有兴趣的话,可以加我微信,我给你演示一下。
2023-05-12 17:53:16 +08:00
回复了 Braisdom 创建的主题 程序员 智能 SQL 分析系统(我的新作品)
@move 可以的
2023-05-10 17:43:42 +08:00
回复了 Braisdom 创建的主题 程序员 智能 SQL 分析系统(我的新作品)
@qingfengxulai1 跨库问题,可以通过 Presto 解决。Agile Query 只能解决 SQL 编译这块,SQL 执行引擎,有很多成熟的方案。
2023-05-09 13:57:54 +08:00
回复了 Braisdom 创建的主题 程序员 智能 SQL 分析系统(我的新作品)
@shuxge1223 你是指 Excel 导入。还是集成到一个 Web Excel 里?
2023-05-08 16:00:37 +08:00
回复了 idragonet 创建的主题 程序员 “国产化” 大家选择什么数据库?人大金仓?
具体要分场景看,目前国内数据库发展的非常快,行业要发展,必须往底层走,不然总是被人牵着鼻子走。

目前我验证过的:华为的 Opengauss, 阿里的 PolarDB-for-PostgreSQL ,腾讯的 TBase 都还有错的,还有各大云平台的数据也都可以。分析型数据库 百度开源的 Apache Doris 就更秒杀一了。我前面就是用 Doris 测试的,几亿数据量的 join 都是秒级出来的。
2023-05-07 10:09:28 +08:00
回复了 idragonet 创建的主题 程序员 “国产化” 大家选择什么数据库?人大金仓?
我用的就是国产数据库。性能远超老外的。

https://www.youtube.com/watch?v=98E_gjk0QjQ&t=14s
2023-05-07 10:08:42 +08:00
回复了 pzp 创建的主题 程序员 Java 和大数据的选择
以后用了我这个工具,就方便多了,链接里有一系列产品视频。

https://www.youtube.com/channel/UCN7ckPJv4c9kMHANlHiARdA
2023-05-06 13:55:46 +08:00
回复了 Braisdom 创建的主题 程序员 Agile Query 基于信贷业务的大数据量分析场景演示
@liuxu 有兴趣的话,可以深入沟通一下,可以远程演示。
2023-05-06 13:22:44 +08:00
回复了 Braisdom 创建的主题 程序员 Agile Query 基于信贷业务的大数据量分析场景演示
@liuxu 当然可以接入了,目前分析的指标没有任何缓存,缓存是基于整个查询的,可以按分钟的形式的缓存。
SSD 型号:Crucial/Micron BX/MX1/2/3/500, M5/600, 1100 SSDs

本次演示的目的是为了验证 Agile Query 的大数据量的分析场景下的表现。另外,数据没有预先加载到内存中,每次都会从磁盘中拉取的。计算完会及时释放。
2023-04-22 08:16:00 +08:00
回复了 Braisdom 创建的主题 程序员 Agile Query 全流程演示视频
@ervqq 大宽表和 SQL 带来的副作用,只有数据工程师才能深刻体会了。
2023-04-22 08:13:30 +08:00
回复了 Braisdom 创建的主题 程序员 Agile Query 全流程演示视频
@ervqq Agile Query 本质上就是面对复杂业务的,能够让中大型企业,不需要大宽表,不需要写 SQL 就能完成所有的数据分析。
1 ... 10  11  12  13  14  15  16  17  18  19 ... 31  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2625 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 18ms · UTC 15:18 · PVG 23:18 · LAX 07:18 · JFK 10:18
Developed with CodeLauncher
♥ Do have faith in what you're doing.