手把手教你使用Flask搭建ES搜索引擎(实战篇)-益强资讯全景

IT科技: 手把手教你使用Flask搭建ES搜索引擎(实战篇)
时间：2010-12-5 17:23:32  作者：系统运维   来源：IT科技类资讯  查看：  评论：0
内容摘要：现在正式进入主题：开始使用 Flask 搭建 ES 搜索。1 配置文件Config.py#coding:utf-8importosDB_USERNAME=rootDB_PASSWORD=None#如果
现在正式进入主题：开始使用 Flask 搭建 ES 搜索。手把手教使用S搜索引
1 配置文件
Config.py
#coding:utf-8 import os DB_USERNAME = root DB_PASSWORD = None # 如果没有密码的擎实话 DB_HOST = 127.0.0.1 DB_PORT = 3306 DB_NAME = flask_es class Config:     SECRET_KEY ="随机字符" # 随机 SECRET_KEY     SQLALCHEMY_COMMIT_ON_TEARDOWN = True # 自动提交     SQLALCHEMY_TRACK_MODIFICATIONS = True # 自动sql     DEBUG = True # debug模式     SQLALCHEMY_DATABASE_URI = mysql+pymysql://%s:%s@%s:%s/%s % (DB_USERNAME, DB_PASSWORD,DB_HOST, DB_PORT, DB_NAME) #数据库URL     MAIL_SERVER = smtp.qq.com     MAIL_POST = 465     MAIL_USERNAME = 3417947630@qq.com     MAIL_PASSWORD = 邮箱授权码     FLASK_MAIL_SUBJECT_PREFIX=M_KEPLER     FLASK_MAIL_SENDER=MAIL_USERNAME # 默认发送人     # MAIL_USE_SSL = True     MAIL_USE_TLS = False
这是一份相对简单的 Flask Config 文件，当然对于当前项目来说数据库的战篇连接不是必要的，我只是手把手教使用S搜索引用 Mysql 来作为辅助用，小伙伴们没有必要配置连接数据库，擎实有 ES 足以。战篇然后邮箱通知这个看个人需求 .....
2 日志
Logger.py
日志模块在工程应用中是手把手教使用S搜索引必不可少的一环，根据不同的擎实生产环境来输出日志文件是非常有必要的。用句江湖上的战篇话来说: "如果没有日志文件，你死都不知道怎么死的亿华云手把手教使用S搜索引 ....."
# coding=utf-8 import os import logging import logging.config as log_conf import datetime import coloredlogs coloredlogs.DEFAULT_FIELD_STYLES = { asctime: { color: green}, hostname: { color: magenta}, levelname: { color: magenta, bold: False}, name: { color: green}} log_dir = os.path.dirname(os.path.dirname(__file__)) + /logs if not os.path.exists(log_dir):     os.mkdir(log_dir) today = datetime.datetime.now().strftime("%Y-%m-%d") log_path = os.path.join(log_dir, today + ".log") log_config = {      version: 1.0,     # 格式输出     formatters: {          colored_console: {                          format: "%(asctime)s - %(name)s - %(levelname)s - %(message)s",                         datefmt: %H:%M:%S         },         detail: {              format: %(asctime)s - %(name)s - %(levelname)s - %(message)s,             datefmt: "%Y-%m-%d %H:%M:%S"  #时间格式         },     },     handlers: {          console: {              class: logging.StreamHandler,              level: DEBUG,             formatter: colored_console         },         file: {              class: logging.handlers.RotatingFileHandler,               maxBytes: 1024 * 1024 * 1024,               backupCount: 1,              filename: log_path,              level: INFO,               formatter: detail,  #              encoding: utf-8,  # utf8 编码  防止出现编码错误         },     },     loggers: {          logger: {              handlers: [console],               level: DEBUG,          },     } } log_conf.dictConfig(log_config) log_v = logging.getLogger(log) coloredlogs.install(level=DEBUG, logger=log_v) # # Some examples. # logger.debug("this is a debugging message") # logger.info("this is an informational message") # logger.warning("this is a warning message") # logger.error("this is an error message")
这里准备好了一份我常用的日志配置文件，可作为常用的擎实日志格式，直接调用即可，战篇根据不同的手把手教使用S搜索引等级来输出到终端或 .log 文件，拿走不谢。擎实
3 路由
对于 Flask 项目而言，战篇蓝图和路由会让整个项目更具观赏性(当然指的是代码的阅读)。
这里我采用两个分支来作为数据支撑，一个是 Math 入口，另一个是 Baike 入口，数据的来源是基于上一篇的百度百科爬虫所得，高防服务器根据深度优先的爬取方式抓取后放入 ES 中。
# coding:utf8 from flask import Flask from flask_sqlalchemy import SQLAlchemy from app.config.config import Config from flask_mail import Mail from flask_wtf.csrf import CSRFProtect app = Flask(__name__,template_folder=templates,static_folder=static) app.config.from_object(Config) db = SQLAlchemy(app) db.init_app(app) csrf = CSRFProtect(app) mail = Mail(app) # 不要在生成db之前导入注册蓝图。 from app.home.baike import baike as baike_blueprint from app.home.math import math as math_blueprint from app.home.home import home as home_blueprint app.register_blueprint(home_blueprint) app.register_blueprint(math_blueprint,url_prefix="/math") app.register_blueprint(baike_blueprint,url_prefix="/baike") # -*- coding:utf-8 -*- from flask import Blueprint baike = Blueprint("baike", __name__) from app.home.baike import views # -*- coding:utf-8 -*- from flask import Blueprint math = Blueprint("math", __name__) from app.home.math import views
声明路由并在 __init__ 文件中初始化
下面来看看路由的实现(以Baike为例)
# -*- coding:utf-8 -*- import os from flask_paginate import Pagination, get_page_parameter from app.Logger.logger import log_v from app.elasticsearchClass import elasticSearch from app.home.forms import SearchForm from app.home.baike import baike from flask import request, jsonify, render_template, redirect baike_es = elasticSearch(index_type="baike_data",index_name="baike") @baike.route("/") def index():     searchForm = SearchForm()     return render_template(baike/index.html, searchForm=searchForm) @baike.route("/search", methods=[GET, POST]) def baikeSearch():     search_key = request.args.get("b", default=None)     if search_key:         searchForm = SearchForm()         log_v.error("[+] Search Keyword: " + search_key)         match_data = baike_es.search(search_key,count=30)         # 翻页         PER_PAGE = 10         page = request.args.get(get_page_parameter(), type=int, default=1)         start = (page - 1) * PER_PAGE         end = start + PER_PAGE         total = 30         print("最大数据总量:", total)         pagination = Pagination(page=page, start=start, end=end, total=total)         context = {              match_data: match_data["hits"]["hits"][start:end],             pagination: pagination,             uid_link: "/baike/"         }         return render_template(data.html, q=search_key, searchForm=searchForm, **context)     return redirect(home.index) @baike.route(/<uid>) def baikeSd(uid):     base_path = os.path.abspath(app/templates/s_d/)     old_file = os.listdir(base_path)[0]     old_path = os.path.join(base_path, old_file)     file_path = os.path.abspath(app/templates/s_d/{ }.html.format(uid))     if not os.path.exists(file_path):         log_v.debug("[-] File does not exist, renaming !!!")         os.rename(old_path, file_path)     match_data = baike_es.id_get_doc(uid=uid)     return render_template(s_d/{ }.html.format(uid), match_data=match_data)
可以看到我们成功的将 elasticSearch 类初始化并且进行了数据搜索。
我们使用了 Flask 的分页插件进行分页并进行了单页数量的限制，根据 Uid 来跳转到详情页中。
细心的小伙伴会发现我这里用了个小技巧
@baike.route(/<uid>) def baikeSd(uid):     base_path = os.path.abspath(app/templates/s_d/)     old_file = os.listdir(base_path)[0]     old_path = os.path.join(base_path, old_file)     file_path = os.path.abspath(app/templates/s_d/{ }.html.format(uid))     if not os.path.exists(file_path):         log_v.debug("[-] File does not exist, renaming !!!")         os.rename(old_path, file_path)     match_data = baike_es.id_get_doc(uid=uid)     return render_template(s_d/{ }.html.format(uid), match_data=match_data)
以此来保证存放详情页面的模板中始终只保留一个 html 文件。
4 项目启动
一如既往的采用 flask_script 作为项目的启动方案，确实方便。
# coding:utf8 from app import app from flask_script import Manager, Server manage = Manager(app) # 启动命令 manage.add_command("runserver", Server(use_debugger=True)) if __name__ == "__main__":     manage.run()
黑窗口键入
python manage.py runserver
就可以启动项目，默认端口 5000，访问 http://127.0.0.1:5000
使用gunicorn启动
gunicorn -c gconfig.py manage:app #encoding:utf-8 import multiprocessing from gevent import monkey monkey.patch_all() # 并行工作进程数 workers = multiprocessing.cpu_count() * 2 + 1 debug = True reload = True # 自动重新加载 loglevel = debug # 指定每个工作者的线程数 threads = 2 # 转发为监听端口8000 bind = 0.0.0.0:5001 # 设置守护进程,将进程交给supervisor管理 daemon = false # 工作模式协程 worker_class = gevent # 设置最大并发量 worker_connections = 2000 # 设置进程文件目录 pidfile = log/gunicorn.pid logfile = log/debug.log # 设置访问日志和错误信息日志路径 accesslog = log/gunicorn_acess.log errorlog = log/gunicorn_error.log
项目截图
项目 Github 地址
https://github.com/GZKY-PY/Flask-ES
芯片行业再现裁员！Imagination Technologies宣布裁减130人
 数据中心抵御停电的四种更环保的方式

最近更新

2025-10-03 00:24:26
数据中心设计的演变：从传统到可持续解决方案
2025-10-03 00:24:26
10个例子带你了解机器学习中的线性代数
2025-10-03 00:24:26
10种最常见的Javascript错误——总结于1000+个项目，并阐述如何避免
2025-10-03 00:24:26
HackerRank开发者调查报告：Python最受欢迎
2025-10-03 00:24:26
利用闪存使数据中心走向绿色低碳
2025-10-03 00:24:26
2018 年第一季度报告：JavaScript 仍是最热门语言
2025-10-03 00:24:26
50行Python代码实现人脸检测
2025-10-03 00:24:26
这些让程序员目瞪口呆的Bug ，愿新的一年里你不会遇到

热门排行

2025-10-03 00:24:26
NVIDIA持续深耕元宇宙，为业界提供最优的软硬件整体解决方案
2025-10-03 00:24:26
从2017年 Java 市场需求看程序员风光背后的危机！
2025-10-03 00:24:26
1分钟了解相似性推荐
2025-10-03 00:24:26
Spring Cloud构建微服务架构：分布式服务跟踪（收集原理）
2025-10-03 00:24:26
2022ODCC峰会上，华为为数据中心持续进化提供了哪些解题思路
2025-10-03 00:24:26
别黑JavaScript了，它真的又“老”又潮
2025-10-03 00:24:26
Swift 成为增长最快的编程语言已经杀入前十直逼C语言
2025-10-03 00:24:26
你的微服务敢独立交付么？

友情链接