From 10ca267b574471dfeb6c7c80e1e0c76675e43b06 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E5=A7=9C=E9=9B=A8=E8=8F=B2?= <2574550132@qq.com>
Date: Sun, 9 Nov 2025 21:32:43 +0800
Subject: [PATCH] =?UTF-8?q?=E6=B7=BB=E5=8A=A0=20feeds.py=20=E6=B3=A8?=
 =?UTF-8?q?=E9=87=8A?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 djangoblog/elasticsearch_backend.py | 208 ++++++----------------------
 djangoblog/feeds.py                 |  34 ++++-
 2 files changed, 78 insertions(+), 164 deletions(-)

diff --git a/djangoblog/elasticsearch_backend.py b/djangoblog/elasticsearch_backend.py
index 78c08534..2ccc3f80 100644
--- a/djangoblog/elasticsearch_backend.py
+++ b/djangoblog/elasticsearch_backend.py
@@ -1,8 +1,3 @@
-# Django博客系统Elasticsearch搜索引擎集成模块
-# 功能：基于Haystack框架封装Elasticsearch全文检索能力，专为博客文章搜索设计
-# 核心能力包括：文章索引的创建/更新/删除、标题+正文全文搜索、搜索推荐词生成、搜索结果格式化
-# 适配Haystack接口规范，可直接集成到Django项目，提供高效、可扩展的文章检索服务
-
 from django.utils.encoding import force_str
 from elasticsearch_dsl import Q
 from haystack.backends import BaseEngine, BaseSearchBackend, BaseSearchQuery, log_query
@@ -10,226 +5,146 @@ from haystack.forms import ModelSearchForm
 from haystack.models import SearchResult
 from haystack.utils import log as logging
 
-# 导入文章Elasticsearch文档定义、文档管理器及文章模型
 from blog.documents import ArticleDocument, ArticleDocumentManager
 from blog.models import Article
 
-# 初始化日志记录器，记录搜索过程中的关键操作和异常
 logger = logging.getLogger(__name__)
 
 
 class ElasticSearchBackend(BaseSearchBackend):
-    """
-    Elasticsearch搜索后端实现类，继承Haystack BaseSearchBackend
-    负责与Elasticsearch集群交互，处理索引CRUD操作和搜索请求执行
-    """
     def __init__(self, connection_alias, **connection_options):
-        """
-        初始化搜索后端
-        :param connection_alias: 连接别名（对应Haystack配置中的连接标识）
-        :param connection_options: 连接配置参数（如地址、端口、认证信息等）
-        """
         super(
             ElasticSearchBackend,
             self).__init__(
             connection_alias,
             **connection_options)
-        # 初始化文章文档管理器，封装Elasticsearch索引操作
         self.manager = ArticleDocumentManager()
-        # 启用拼写/近义词推荐功能
         self.include_spelling = True
 
     def _get_models(self, iterable):
-        """
-        将模型实例列表转换为Elasticsearch文档对象
-        :param iterable: 模型实例列表（可为空）
-        :return: 转换后的ArticleDocument文档列表
-        """
-        # 若输入为空，默认查询所有文章模型实例
         models = iterable if iterable and iterable[0] else Article.objects.all()
-        # 调用文档管理器的转换方法，将模型实例转为Elasticsearch文档
         docs = self.manager.convert_to_doc(models)
         return docs
 
     def _create(self, models):
-        """
-        新建索引并批量写入文档
-        :param models: 待索引的文章模型实例列表
-        """
-        self.manager.create_index()  # 创建Elasticsearch索引（若不存在）
-        docs = self._get_models(models)  # 转换模型为文档
-        self.manager.rebuild(docs)  # 批量重建索引（覆盖已有数据）
+        self.manager.create_index()
+        docs = self._get_models(models)
+        self.manager.rebuild(docs)
 
     def _delete(self, models):
-        """
-        从索引中删除指定文档
-        :param models: 待删除的文档对应的模型实例列表
-        :return: 操作结果标识（固定返回True）
-        """
         for m in models:
-            m.delete()  # 调用文档对象的删除方法，从Elasticsearch移除
+            m.delete()
         return True
 
     def _rebuild(self, models):
-        """
-        重建索引（增量更新）
-        :param models: 待更新的模型实例列表（可为空，空则更新所有文章）
-        """
         models = models if models else Article.objects.all()
-        docs = self._get_models(models)  # 转换模型为文档
-        self.manager.update_docs(docs)  # 批量更新索引文档
+        docs = self.manager.convert_to_doc(models)
+        self.manager.update_docs(docs)
 
     def update(self, index, iterable, commit=True):
-        """
-        Haystack标准接口：更新索引（新增/修改文档）
-        :param index: 索引名称（当前实现未使用，由文档管理器维护）
-        :param iterable: 待更新的模型实例列表
-        :param commit: 是否立即提交（当前实现强制提交）
-        """
+
         models = self._get_models(iterable)
-        self.manager.update_docs(models)  # 调用文档管理器执行更新
+        self.manager.update_docs(models)
 
     def remove(self, obj_or_string):
-        """
-        Haystack标准接口：删除索引中的指定对象
-        :param obj_or_string: 模型实例或对象唯一标识字符串
-        """
         models = self._get_models([obj_or_string])
-        self._delete(models)  # 调用内部删除方法处理
+        self._delete(models)
 
     def clear(self, models=None, commit=True):
-        """
-        Haystack标准接口：清空索引
-        :param models: 可选，指定要清空的模型类（当前实现未使用）
-        :param commit: 是否立即提交（当前实现强制提交）
-        """
-        self.remove(None)  # 传入None触发删除所有文档
+        self.remove(None)
 
     @staticmethod
     def get_suggestion(query: str) -> str:
-        """
-        基于Elasticsearch的term suggest功能获取搜索推荐词
-        :param query: 原始搜索关键词
-        :return: 拼接后的推荐词字符串（无推荐时返回原关键词）
-        """
-        # 构建搜索请求：匹配正文字段，同时启用术语推荐
+        """获取推荐词, 如果没有找到添加原搜索词"""
+
         search = ArticleDocument.search() \
             .query("match", body=query) \
             .suggest('suggest_search', query, term={'field': 'body'}) \
             .execute()
 
         keywords = []
-        # 解析推荐结果，提取推荐词（无推荐时保留原词）
         for suggest in search.suggest.suggest_search:
             if suggest["options"]:
-                keywords.append(suggest["options"][0]["text"])  # 取置信度最高的推荐词
+                keywords.append(suggest["options"][0]["text"])
             else:
-                keywords.append(suggest["text"])  # 无推荐词时使用原搜索词
+                keywords.append(suggest["text"])
 
-        return ' '.join(keywords)  # 拼接推荐词为字符串返回
+        return ' '.join(keywords)
 
     @log_query
     def search(self, query_string, **kwargs):
-        """
-        Haystack标准接口：执行搜索请求
-        :param query_string: 搜索关键词
-        :param kwargs: 额外参数（包含分页、过滤条件等）
-        :return: 格式化后的搜索结果字典
-        """
-        logger.info('search query_string:' + query_string)  # 记录搜索关键词
+        logger.info('search query_string:' + query_string)
 
-        # 从参数中提取分页偏移量（起始位置、结束位置）
         start_offset = kwargs.get('start_offset')
         end_offset = kwargs.get('end_offset')
 
-        # 处理搜索推荐：根据is_suggest标识决定是否使用推荐词
+        # 推荐词搜索
         if getattr(self, "is_suggest", None):
-            suggestion = self.get_suggestion(query_string)  # 获取推荐词
+            suggestion = self.get_suggestion(query_string)
         else:
-            suggestion = query_string  # 不启用推荐，使用原搜索词
+            suggestion = query_string
 
-        # 构建Elasticsearch查询条件：布尔查询
-        # should子句：匹配正文或标题，最小匹配度70%（确保结果相关性）
         q = Q('bool',
               should=[Q('match', body=suggestion), Q('match', title=suggestion)],
               minimum_should_match="70%")
 
-        # 构建完整搜索请求：包含过滤条件、分页、字段筛选
         search = ArticleDocument.search() \
                      .query('bool', filter=[q]) \
-                     .filter('term', status='p')  # 过滤已发布（status='p'）的文章
-                     .filter('term', type='a')    # 过滤文章类型（type='a'）
-                     .source(False)               # 不返回原始文档内容，仅保留ID和得分
-                     [start_offset: end_offset]   # 分页截取结果集
+                     .filter('term', status='p') \
+                     .filter('term', type='a') \
+                     .source(False)[start_offset: end_offset]
 
-        # 执行搜索并解析结果
         results = search.execute()
-        hits = results['hits'].total  # 总命中数
+        hits = results['hits'].total
         raw_results = []
-
-        # 转换Elasticsearch原始结果为Haystack SearchResult格式
         for raw_result in results['hits']['hits']:
-            app_label = 'blog'  # 应用标签（固定为博客应用）
-            model_name = 'Article'  # 模型名称（固定为文章模型）
-            additional_fields = {}  # 额外字段（当前无扩展字段需求）
+            app_label = 'blog'
+            model_name = 'Article'
+            additional_fields = {}
 
             result_class = SearchResult
-            # 构建SearchResult实例，适配Haystack结果格式
+
             result = result_class(
                 app_label,
                 model_name,
-                raw_result['_id'],  # 文档ID（对应文章模型主键）
-                raw_result['_score'],  # 搜索匹配得分
+                raw_result['_id'],
+                raw_result['_score'],
                 **additional_fields)
             raw_results.append(result)
-
-        # 封装返回结果（符合Haystack接口规范）
-        facets = {}  # 聚合统计结果（当前未启用聚合功能）
-        # 拼写推荐词：仅当推荐词与原搜索词不同时返回
+        facets = {}
         spelling_suggestion = None if query_string == suggestion else suggestion
 
         return {
-            'results': raw_results,  # 搜索结果列表（SearchResult实例集合）
-            'hits': hits,            # 总命中数
-            'facets': facets,        # 聚合统计数据（空）
-            'spelling_suggestion': spelling_suggestion,  # 推荐词（无则为None）
+            'results': raw_results,
+            'hits': hits,
+            'facets': facets,
+            'spelling_suggestion': spelling_suggestion,
         }
 
 
 class ElasticSearchQuery(BaseSearchQuery):
-    """
-    Elasticsearch搜索查询类，继承Haystack BaseSearchQuery
-    负责构建搜索查询参数、处理用户输入清理、格式转换等
-    """
     def _convert_datetime(self, date):
-        """
-        转换日期时间为Elasticsearch支持的字符串格式
-        :param date: 日期时间对象
-        :return: 格式化后的日期时间字符串
-        """
         if hasattr(date, 'hour'):
-            # 带时分秒的日期：格式化为YYYYMMDDHHMMSS
             return force_str(date.strftime('%Y%m%d%H%M%S'))
         else:
-            # 仅日期：格式化为YYYYMMDD000000（补零时分秒）
             return force_str(date.strftime('%Y%m%d000000'))
 
     def clean(self, query_fragment):
         """
-        清理用户输入的搜索关键词，避免特殊字符影响查询执行
-        处理逻辑：保留词转小写、含特殊字符的词用单引号包裹
-        :param query_fragment: 原始搜索关键词片段
-        :return: 清理后的搜索关键词
+        Provides a mechanism for sanitizing user input before presenting the
+        value to the backend.
+
+        Whoosh 1.X differs here in that you can no longer use a backslash
+        to escape reserved characters. Instead, the whole word should be
+        quoted.
         """
         words = query_fragment.split()
         cleaned_words = []
 
         for word in words:
-            # 处理Haystack保留词：转换为小写
             if word in self.backend.RESERVED_WORDS:
                 word = word.replace(word, word.lower())
 
-            # 处理保留字符：包含特殊字符则用单引号包裹
             for char in self.backend.RESERVED_CHARACTERS:
                 if char in word:
                     word = "'%s'" % word
@@ -240,62 +155,29 @@ class ElasticSearchQuery(BaseSearchQuery):
         return ' '.join(cleaned_words)
 
     def build_query_fragment(self, field, filter_type, value):
-        """
-        构建查询片段（适配Haystack过滤条件）
-        :param field: 过滤字段名称
-        :param filter_type: 过滤类型（如精确匹配、模糊匹配等）
-        :param value: 过滤值（需包含query_string属性）
-        :return: 过滤对应的查询字符串
-        """
         return value.query_string
 
     def get_count(self):
-        """
-        获取搜索结果总数
-        :return: 结果列表长度（即命中数）
-        """
         results = self.get_results()
         return len(results) if results else 0
 
     def get_spelling_suggestion(self, preferred_query=None):
-        """
-        获取拼写推荐词
-        :param preferred_query: 优先使用的查询词（当前未使用）
-        :return: 搜索后端返回的推荐词
-        """
         return self._spelling_suggestion
 
     def build_params(self, spelling_query=None):
-        """
-        构建搜索参数（适配Haystack接口，传递给后端执行）
-        :param spelling_query: 拼写推荐查询词（当前未使用）
-        :return: 搜索参数字典
-        """
         kwargs = super(ElasticSearchQuery, self).build_params(spelling_query=spelling_query)
         return kwargs
 
 
 class ElasticSearchModelSearchForm(ModelSearchForm):
-    """
-    自定义搜索表单类，继承Haystack ModelSearchForm
-    扩展功能：支持通过请求参数控制是否启用搜索推荐
-    """
+
     def search(self):
-        """
-        执行搜索（重写父类方法）
-        逻辑：根据请求参数is_suggest设置后端推荐开关，再调用父类搜索方法
-        :return: 搜索结果集（SearchQuerySet）
-        """
-        # 是否启用搜索推荐：请求参数is_suggest != "no"时启用
+        # 是否建议搜索
         self.searchqueryset.query.backend.is_suggest = self.data.get("is_suggest") != "no"
-        sqs = super().search()  # 调用父类方法执行搜索
+        sqs = super().search()
         return sqs
 
 
 class ElasticSearchEngine(BaseEngine):
-    """
-    Elasticsearch搜索引擎入口类，继承Haystack BaseEngine
-    定义搜索引擎的后端和查询类，供Haystack框架识别和调用
-    """
-    backend = ElasticSearchBackend  # 绑定搜索后端类
-    query = ElasticSearchQuery      # 绑定搜索查询类
\ No newline at end of file
+    backend = ElasticSearchBackend
+    query = ElasticSearchQuery
\ No newline at end of file
diff --git a/djangoblog/feeds.py b/djangoblog/feeds.py
index 8c4e851c..ee07797f 100644
--- a/djangoblog/feeds.py
+++ b/djangoblog/feeds.py
@@ -1,40 +1,72 @@
+#姜雨菲：导入Django用户模型获取工具
 from django.contrib.auth import get_user_model
+#姜雨菲： 导入Django的Feed基类，用于创建RSS/Atom订阅源
 from django.contrib.syndication.views import Feed
+#姜雨菲： 导入时区处理工具
 from django.utils import timezone
+#姜雨菲： 导入RSS 2.0版本的生成器
 from django.utils.feedgenerator import Rss201rev2Feed
 
+#姜雨菲： 导入博客文章模型
 from blog.models import Article
+#姜雨菲： 导入自定义的Markdown处理工具
 from djangoblog.utils import CommonMarkdown
 
 
 class DjangoBlogFeed(Feed):
+    """博客网站的RSS订阅源类，继承自Django的Feed基类"""
+
+    #姜雨菲： 指定订阅源类型为RSS 2.0版本
     feed_type = Rss201rev2Feed
 
+    # 订阅源的描述信息
     description = '大巧无工,重剑无锋.'
+    # 订阅源的标题
     title = "且听风吟 大巧无工,重剑无锋. "
+    # 订阅源的链接（相对路径）
     link = "/feed/"
 
     def author_name(self):
+        """返回订阅源作者名称"""
+        # 获取第一个用户的昵称作为作者名
         return get_user_model().objects.first().nickname
 
     def author_link(self):
+        """返回订阅源作者的链接"""
+        # 获取第一个用户的绝对URL
         return get_user_model().objects.first().get_absolute_url()
 
     def items(self):
+        """
+        定义订阅源包含的项目列表
+        返回最新发布的5篇文章
+        """
+        # 筛选类型为'article'(a)且状态为'published'(p)的文章
+        # 按发布时间倒序排列，取前5篇
         return Article.objects.filter(type='a', status='p').order_by('-pub_time')[:5]
 
     def item_title(self, item):
+        """返回单个项目（文章）的标题"""
         return item.title
 
     def item_description(self, item):
+        """返回单个项目（文章）的描述"""
+        # 将文章正文从Markdown格式转换为HTML
         return CommonMarkdown.get_markdown(item.body)
 
     def feed_copyright(self):
+        """返回订阅源的版权信息"""
+        # 获取当前时间，并格式化版权信息
         now = timezone.now()
         return "Copyright© {year} 且听风吟".format(year=now.year)
 
     def item_link(self, item):
+        """返回单个项目（文章）的链接"""
         return item.get_absolute_url()
 
     def item_guid(self, item):
-        return
+        """
+        返回单个项目的唯一标识符(guid)
+        此处返回空值，实际应用中通常应返回唯一标识如文章ID等
+        """
+        return
\ No newline at end of file