Real-time ML with Spark
本文主要介绍如何使用 Apache Spark 实现实时的机器学习。
本文主要介绍如何使用 Apache Spark 实现实时的机器学习。
Apache Superset™ is a modern data exploration and visualization platform.
Python 几大著名 Web 框架之一,以其轻量级,高可扩展性而著名
Jinja2
模板引擎
Werkzeug
WSGI 工具集
Gunicorn 是一个开源的 Python WSGI HTTP 服务器,移植于 Ruby 的 Unicorn 项目的采用 pre-fork 模式的服务器
WSGI,即 Python Web Server Gateway Interface,是专门用于 Python 应用程序或框架与 Web 服务器之间的一种接口,没有官方的实现,因为 WSGI 更像一个协议,只要遵照这些协议,WSGI 应用都可以在 任何服务器上运行,反之亦然
一个进程处理一个请求,基于 select 模型,所以最多一次创建 1024 个进程
预先创建进程,pre-fork 采用的是预派生子进程方式,用子进程处理不同的请求,每个请求对应一个子进程,进程之间是彼此独立的
一定程度上加快了进程的响应速度
介绍 Apache HBase 的基本概念、环境部署、常用命令、实战技巧、架构设计和性能优化,并记录了一些踩过的坑,及其解决方案。
Apache Calcite™ is a dynamic data management framework.
用于定义 SQL 语义相关的元数据与命名空间
负责将 SQL 转化成 AST(Abstract Syntax Tree)
负责通过 Catalog 对 AST 进行校证
负责将 AST 转化成物理执行计划、优化物理执行计划
负责将物理执行计划反向转化成 SQL 语句