归档: 2023/10

2023

10

27

一、问题的根源：被历史数据拖垮的OLTP核心一个典型的技术困境始于一个成功的业务系统。我们的核心交易系统，构建在 SQL Server 之上，稳定运行多年。但随着业务量指数级增长，Orders、OrderItems、TransactionL

2023-10-27 架构与设计

NoSQL Packer SQL Server Phoenix Lua

27

微服务拆分后，一个用户请求可能流经十几个后台服务。当性能下降或出现错误时，定位问题根源的挑战呈指数级增长。我们团队最初的观测体系是割裂的：使用 Jaeger 进行分布式链路追踪，而日志则全部推送到 OpenSearch 集群。问题很快浮现：

2023-10-27 可观测性

Go 分布式追踪 OpenSearch OpenTelemetry 日志系统

27

团队的集成测试CI流水线又红了。原因和上周一样：某个并发的测试用例污染了共享的Staging MySQL数据库，导致后续依赖特定初始状态的测试断言失败。清理数据库、重跑任务，半个小时就这么过去了。这种基于共享环境的测试策略，其脆弱性在团队扩

2023-10-27 DevOps

MySQL 测试基础设施即代码 GraphQL Terraform Terratest

27

定义一个棘手的两难问题在构建现代数据密集型应用，尤其是涉及AI驱动功能的系统时，我们经常面临一个架构上的两难困境。系统需要同时满足两种截然不同的查询模式，并且对延迟和吞吐量都有着极为苛刻的要求。第一种是传统的键值（Key-Value）或宽

2023-10-27 架构与设计

Rust Cassandra Qwik Pinecone Azure Service Bus

27

项目初期，我们面临一个棘手的需求：移动端应用需要根据用户最近输入的文本（例如搜索查询、笔记内容）动态生成个性化推荐。这些推荐依赖于文本的语义向量表示，这意味着我们需要一个可靠的NLP模型。在移动设备上本地运行 bert-base-multi

2023-10-27 MLOps

MariaDB Dart Celery Hugging Face Transformers MLflow

27

在一个已经稳定运行的系统中，平台工程团队使用 Terraform 精准地管理着所有底层云资源——从 VPC 网络到 Kubernetes 集群，再到独立的 Solr 云主机集群。一切看起来井然有序，基础设施的变更遵循着严格的 GitOps

2023-10-27 DevOps

Ansible Terraform Kong Pulumi Solr