Bao: Making Learned Query Optimization Practical MLDB + query optimization ABSTRACT 最近 ML 做 query optimization 由于需要 substantive training overhead 所以其实很少 practical gains, inability to adapt to changes, poor tail performance. 论文提出了 Bao, Bandit Optimizer, 通过利用现有查询优化器的知识,对每个查询提供
Zero-Shot Cost Models for Out-of-the-box Learned Cost Prediction [VLDB 2022] Abstract 本文介绍了 zero-shot cost model,该模型可以使学习的成本估算能够 generalizes to unseen databases。与最 state-of-the-art 的工作负载驱动的方法相反,这些
SPADE: Synthesizing Assertions for Large Language Model Pipelines Synthesizing Assertions Pipelines 合成断言、流水线 ABSTRACT 将大型语言模型(LLM)用于定制、重复数据 pipeline 的操作具有挑战性,特别是由于其不可预测和潜在的灾难性故障
SEED: Domain-Specific Data Curation With Large Language Models 使用大型语言模型的 领域特定 数据管理 ABSTRACT 准备分析数据的数据管理任务 Data Curation 对于将数据转换为可行的见解至关重要。但是,由于不同域中的应
AnalyticDB-V: A Hybrid Analytical Engine Towards Query Fusion for Structured and Unstructured Data ABSTRACT 随着非结构化数据的爆炸性增长(例如图像,视频和音频),非结构化数据分析在真实世界应用的丰富脉络中广泛存在。许多数
Milvus:A Purpose-Built Vector Data Management System ABSTRACT 最近,数据科学和人工智能应用中迫切需要管理高维向量数据。 非结构化数据和机器学习 (ML) 的激增推动了这一趋势,其中 ML 模型
VBase: Unifying Online Vector Similarity Search and Relational Queries via Relaxed Monotonicity VBase: 通过 Relaxed Monotonicity (松弛单调性) 统一在线矢量相似性搜索和关系查询 Abstract 基于高维向量索引的近似相似度查询 approximate similarity queries已经成为
第二章:数据模型与查询语言 数据模型可能是软件开发中最重要的部分了,因为它们的影响如此深远:不仅仅影响着软件的编写方式,而且影响着我们的 解题思
DB-BERT: a databse tuning tool that reads the manual DB-BERT,一个读了手册的数据库调优工具 https://arxiv.org/pdf/2112.10925.pdf Abstract DB-BERT 是一种数据库调优工具,可利用通过对手册和其他相关文本文档进行自然语言分析
NodeJS 这学期要用 JS 写分布式,看 Ryan Dahl 在 2009 年 JSConf 上分享 NodeJS 背后的概念,刚好复习一下 JS 的一些知识 NodeJS 简述: Server Side Javascript Built on Google’s V8 Evented, non-blocking IO, similar to EventMachine or Python’s Twisted. CommonJS module system (用 ES6 Module 替代