您当前的位置:首页 > IT编程 > python
| C语言 | Java | VB | VC | python | Android | TensorFlow | C++ | oracle | 学术与代码 | cnn卷积神经网络 | gnn | 图像修复 | Keras | 数据集 | Neo4j | 自然语言处理 | 深度学习 | 医学CAD | 医学影像 | 超参数 | pointnet | pytorch |

自学教程:Django对接elasticsearch实现全文检索的示例代码

51自学网 2021-10-30 22:24:50
  python
这篇教程Django对接elasticsearch实现全文检索的示例代码写得很实用,希望能帮到您。

前言

说到搜索,第一时间想到的是mysql数据库的like语句

但是,假如你的数据库有几千万条数据,name字段没有索引,可能查询需要十几分钟,用户可能会等你?那为什么不给name字段增加索引?数据表不仅仅是用来查询,也会经常修改数据,新增删除数据等。建立索引后,做增删改操作时也会大大占用数据库资源。所以应该怎么解决呢?

Elasticsearch!

一个强大的基于Lucene的全文搜索服务器!维基百科、Stack Overflow、Github都在用。

如果想详细了解其原理的话,可以参考:https://www.elastic.co/guide/index.html

第一步:首先安装相关的依赖包

pip install drf-haystack pip install elasticsearch pip install djangorestframework

第二步:在django项目配置文件settings.py中注册应用

INSTALLED_APPS = ['app.apps.AppConfig', 'haystack', 'rest_framework']

第三步:在django项目配置文件settings.py中指定搜索的后端

HAYSTACK_CONNECTIONS = { 'default':    {            'ENGINE':'haystack.backends.elasticsearch_backend.ElasticsearchSearchEngine',             'URL': 'http://127.0.0.1:9200/', # 此处为elasticsearch运行的服务器ip地址,端口号固定为9200             'INDEX_NAME': 'test', # 指定elasticsearch建立的索引库的名称             },             } # 当添加、修改、删除数据时,自动生成索引 HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor' # 指定搜索结果每页的条数 # HAYSTACK_SEARCH_RESULTS_PER_PAGE = 1

第四步:创建索引类

在此之前要先创建model类,并插入数据

from django.db import models class Es(models.Model):     name=models.CharField(max_length=32)    desc=models.CharField(max_length=32)

在需要进行索引的应用的目录下创建文件search_indexes.py, 在该文件内创建该索引类
我在app应用下创建:search_indexes.py

# 索引模型类的名称必须是 模型类名称 + Index from haystack import indexes from .models import Es class EsIndex(indexes.SearchIndex, indexes.Indexable):     text = indexes.CharField(document=True, use_template=True)     def get_model(self):     """返回建立索引的模型类"""         return Es     def index_queryset(self, using=None):     """返回要建立索引的数据查询集"""         return self.get_model().objects.all()

第五步:在templates目录中创建text字段使用的模板文件

创建文件templates/search/indexes/app/es_text.txt文件中定义

{{ object.name }} {{ object.desc }}

第六步:手动更新索引

python manage.py rebuild_index   #数据库有多少条数据,全部会被同步到es中

第七步:创建haystack序列化器

from drf_haystack.serializers import HaystackSerializer from rest_framework.serializers import ModelSerializer from app import models from app.search_indexes import EsIndex class EsSerializer(ModelSerializer):     class Meta:         model=models.Es         fields='__all__' class EsIndexSerializer(HaystackSerializer):      object = EsSerializer(read_only=True) # 只读,不可以进行反序列化      class Meta:         index_classes = [EsIndex]# 索引类的名称         fields = ('text', 'object')# text 由索引类进行返回, object 由序列化类进行返回,第一个参数必须是text

第八步:创建视图类

from drf_haystack.viewsets import HaystackViewSet from app.models import Book from app.serializers import EsIndexSerializer class EsSearchView(HaystackViewSet):     index_models = [Es]     serializer_class = EsIndexSerializer

第九步:添加路由

from django.conf.urls import url from django.contrib import admin from rest_framework import routers from app.views import EsSearchView     router = routers.DefaultRouter()     router.register("book/search", EsSearchView, base_name="book-search")     urlpatterns = [ url(r'^admin/', admin.site.urls), ]     urlpatterns += router.urls

第十步:结果

http://127.0.0.1:8000/?text=测试

到此这篇关于Django对接elasticsearch实现全文检索的示例代码的文章就介绍到这了,更多相关Django elasticsearch实现全文检索内容请搜索51zixue.net以前的文章或继续浏览下面的相关文章希望大家以后多多支持51zixue.net!


浅谈Python3中datetime不同时区转换介绍与踩坑
Python获取江苏疫情实时数据及爬虫分析
51自学网,即我要自学网,自学EXCEL、自学PS、自学CAD、自学C语言、自学css3实例,是一个通过网络自主学习工作技能的自学平台,网友喜欢的软件自学网站。
京ICP备13026421号-1