From 12bddb46dab4c483788f5d8b4b054916181125c9 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E8=96=9B=E7=9A=93=E5=A4=A9?= <123456> Date: Wed, 4 Oct 2023 15:27:24 +0800 Subject: [PATCH] update 2023/10/4/15:27 --- src/medicine/cancer_information.sql | 42 + .../Get_Cancer_Information/.idea/.gitignore | 8 + .../.idea/Get_Cancer_Information.iml | 8 + .../inspectionProfiles/Project_Default.xml | 14 + .../inspectionProfiles/profiles_settings.xml | 6 + .../Get_Cancer_Information/.idea/misc.xml | 4 + .../Get_Cancer_Information/.idea/modules.xml | 8 + .../spider/Get_Information.py | 61 + .../Get_Information.cpython-311.pyc | Bin 0 -> 3653 bytes .../spider/use_code.ipynb | 1300 +++++++++++++++++ .../sql/breast-cancer.txt | 3 + .../sql/colorectal-cancer.txt | 3 + .../sql/lung-cancer.txt | 3 + .../Get_Cancer_Information/sql/savesql.py | 66 + 14 files changed, 1526 insertions(+) create mode 100644 src/medicine/cancer_information.sql create mode 100644 src/medicine/癌症数据获取/Get_Cancer_Information/.idea/.gitignore create mode 100644 src/medicine/癌症数据获取/Get_Cancer_Information/.idea/Get_Cancer_Information.iml create mode 100644 src/medicine/癌症数据获取/Get_Cancer_Information/.idea/inspectionProfiles/Project_Default.xml create mode 100644 src/medicine/癌症数据获取/Get_Cancer_Information/.idea/inspectionProfiles/profiles_settings.xml create mode 100644 src/medicine/癌症数据获取/Get_Cancer_Information/.idea/misc.xml create mode 100644 src/medicine/癌症数据获取/Get_Cancer_Information/.idea/modules.xml create mode 100644 src/medicine/癌症数据获取/Get_Cancer_Information/spider/Get_Information.py create mode 100644 src/medicine/癌症数据获取/Get_Cancer_Information/spider/__pycache__/Get_Information.cpython-311.pyc create mode 100644 src/medicine/癌症数据获取/Get_Cancer_Information/spider/use_code.ipynb create mode 100644 src/medicine/癌症数据获取/Get_Cancer_Information/sql/breast-cancer.txt create mode 100644 src/medicine/癌症数据获取/Get_Cancer_Information/sql/colorectal-cancer.txt create mode 100644 src/medicine/癌症数据获取/Get_Cancer_Information/sql/lung-cancer.txt create mode 100644 src/medicine/癌症数据获取/Get_Cancer_Information/sql/savesql.py diff --git a/src/medicine/cancer_information.sql b/src/medicine/cancer_information.sql new file mode 100644 index 00000000..ace6815e --- /dev/null +++ b/src/medicine/cancer_information.sql @@ -0,0 +1,42 @@ +/* + Navicat Premium Data Transfer + + Source Server : 本机 + Source Server Type : MySQL + Source Server Version : 50731 + Source Host : localhost:3306 + Source Schema : db1 + + Target Server Type : MySQL + Target Server Version : 50731 + File Encoding : 65001 + + Date: 04/10/2023 15:25:45 +*/ + +SET NAMES utf8mb4; +SET FOREIGN_KEY_CHECKS = 0; + +-- ---------------------------- +-- Table structure for cancer_information +-- ---------------------------- +DROP TABLE IF EXISTS `cancer_information`; +CREATE TABLE `cancer_information` ( + `癌症名称` varchar(1000) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL, + `重要事实` longtext CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL, + `概述` longtext CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL, + `症状` longtext CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL, + `风险因素` longtext CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL, + `诊断` longtext CHARACTER SET utf8 COLLATE utf8_general_ci NULL, + `治疗和护理` longtext CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL, + PRIMARY KEY (`癌症名称`) USING BTREE +) ENGINE = InnoDB CHARACTER SET = latin1 COLLATE = latin1_swedish_ci ROW_FORMAT = Dynamic; + +-- ---------------------------- +-- Records of cancer_information +-- ---------------------------- +INSERT INTO `cancer_information` VALUES ('乳腺癌', ' 2020年,乳腺癌在全球造成68.5万人死亡。 约有一半的乳腺癌发生在除了性别和年龄之外没有特定风险因素的妇女当中。 全世界各个国家都有乳腺癌。 约有0.5%%至1%%的乳腺癌发生在男性身上。', ' 乳腺癌是一种异常乳腺细胞生长失控并形成肿瘤的疾病。如果不加以控制,肿瘤会扩散到全身并致命。 乳腺癌细胞始于乳房中的乳管和/或产乳小叶内。最早的形式(原位)不会危及生命。癌细胞会扩散到附近的乳腺组织(侵袭)。这会形成肿瘤,导致出现肿块或增厚。 侵袭性癌症可以扩散到附近的淋巴结或其他器官(转移)。转移可能致命。 治疗以患者本人的情况、癌症类型及其扩散程度为依据。治疗方法结合了手术、放射疗法和药物治疗。', ' 乳腺癌可以有多种症状,尤其是在较晚期。大多数人在癌症早期没有任何症状。 乳腺癌的症状可包括: 乳房出现异常肿块的人应就医,即使肿块无疼痛。 大部分乳房肿块不是癌症。癌性乳房肿块在体积小并且未扩散到附近的淋巴结时更有可能得到成功治疗。 乳腺癌可能会扩散到身体的其他部位,并引发其他症状。通常情况下,尽管可能有无法感觉到的淋巴结恶性肿瘤,但最先可以检测到的最常见的扩散部位是手臂下的淋巴结。 随着时间的推移,恶性肿瘤可能会扩散到包括肺、肝、脑和骨骼在内的其他器官。一旦它们到达这些部位,就可能会出现骨痛或头痛等新的与癌症相关的症状。', ' 女性的性别是最强的乳腺癌风险因素。约有0.5%%至1%%的乳腺癌发生在男性身上。男性乳腺癌治疗应遵循与女性相同的管理原则。 某些因素会增加患乳腺癌的风险,包括年龄增长、肥胖、有害使用酒精、乳腺癌家族史、辐射暴露史、生殖史(如月经开始的年龄和首次怀孕的年龄)、使用烟草和绝经后激素治疗。约有一半的乳腺癌发生在除了性别(女性)和年龄(40岁以上)以外没有其他可识别乳腺癌风险因素的妇女当中。 乳腺癌家族史增加了乳腺癌的风险,但大多数被诊断为患有乳腺癌的妇女没有已知的乳腺癌家族史。没有已知的家族史未必意味着女性患有乳腺癌的风险降低。 某些遗传的“高外显率”基因突变大大增加了乳腺癌风险,最主要的是BRCA1、BRCA2和PALB-2基因的突变。被发现这些主要基因中存在突变的女性可以考虑采用手术切除双乳房等降低风险的策略。', ' ', ' 乳腺癌的治疗取决于癌症亚型以及从乳房向外扩散到淋巴结(II期或III期)或身体其他部位(IV期)的程度。 医生会结合不同的治疗方法以最大限度地降低癌症复发的可能性。这些治疗包括: 乳腺癌的治疗如果在早期开始并完成全部疗程,效果和耐受性都会更好。 手术可以只切除癌组织(叫做乳房肿瘤切除术)或整个乳房(乳房切除术)。手术也可以切除淋巴结以评估癌症的扩散能力。 放射疗法治疗的是残留在乳腺组织和/或淋巴结中的微小癌症,可以最大限度地降低癌症在胸壁上复发的可能性。 癌症晚期可能会损害皮肤,导致开放性伤口(溃疡),但不一定疼痛。有乳房伤口不愈情形的妇女应就医并进行活检。 治疗乳腺癌的药物选择依据是由特殊测试(肿瘤标志物测定)确定的癌症生物学特性。用于治疗乳腺癌的绝大多数药物已被列入世卫组织基本药物清单。 在对侵袭性恶性肿瘤实行癌症手术时,淋巴结会被切除。在过去,完全切除腋下淋巴结(完全切除腋窝淋巴结)被认为是防止恶性肿瘤扩散的必要措施。现在,一种叫做“前哨淋巴结活检”的较小淋巴结手术更受欢迎,因为它的并发症较少。 乳腺癌的药物治疗可以在手术前(“新辅助治疗”)或手术后(“辅助治疗”)进行,这取决于癌症的生物学分亚型。表达雌激素受体(ER)和/或孕酮受体(PR)的恶性肿瘤可能对他莫昔芬或芳香酶抑制剂等内分泌(激素)疗法产生反应。口服这些药物五至十年会将这些“激素阳性”恶性肿瘤的复发几率降低近一半。内分泌疗法可能导致出现更年期症状,但通常耐受性良好。 不表达雌激素受体或孕酮受体的恶性肿瘤属于“激素受体阴性”,除非恶性肿瘤很小,否则需要进行化疗。目前可用的化疗方案在减少癌细胞扩散或复发的机会方面非常有效,通常作为门诊治疗手段。在没有并发症的情况下,乳腺癌的化疗通常不需要住院。 乳腺癌可能会独自过度表达一种叫做HER-2/neu癌基因的分子。这些“HER-2阳性”恶性肿瘤可以用曲妥珠单抗等靶向生物制剂进行治疗。这些生物制剂非常有效,但也非常昂贵,因为它们是抗体,而不是化学品。在实施靶向生物治疗时,与化疗结合会使它们能够有效地杀死癌细胞。 在乳腺癌的治疗中,放射治疗起着非常重要的作用。对于早期乳腺癌而言,放射治疗可以防止妇女不得不实行乳房切除术。对于后期癌症而言,即使已经实行了乳房切除术,放射治疗也可降低癌症复发的风险。对于晚期乳腺癌而言,在某些情况下,放射治疗可以降低死于这种疾病的可能性。 乳腺癌治疗的有效性取决于整个治疗过程。局部治疗不太可能取得积极的治疗结果。'); +INSERT INTO `cancer_information` VALUES ('结直肠癌', ' 结直肠癌是全世界第三常见的癌症,约占所有癌症病例的10%%,它也是全世界癌症相关死亡的第二大原因。 结直肠癌主要影响老年人,大多数病例在50岁及以上。 一些生活方式因素会促发结直肠癌,例如加工肉制品摄入量高而水果和蔬菜摄入量低、久坐不动的生活方式、肥胖症、吸烟和过量饮酒。 结直肠癌常常在治疗选择有限的晚期才被诊断出来。 通过实施初级预防战略,例如采用健康的生活方式、避免风险因素和通过筛查早期发现,可以显著降低结直肠癌的发病率和影响。', ' 结直肠癌是一种影响结肠(大肠)或直肠的癌症。它是全世界最常见的癌症类型之一,可以导致严重伤害和死亡。 结直肠癌的风险随着年龄的增长而增加。大多数病例在50岁以上。 常见症状包括腹泻、便秘、便血、腹痛、不明原因体重减轻、疲劳和铁含量低。 许多人在该病的早期阶段没有症状。 通过健康饮食、保持身体活动、不吸烟和限制饮酒,可以降低患结直肠癌的风险。定期筛查对于早期发现至关重要。 结肠癌是全球癌症相关死亡的第二大原因。2020年,估计全球范围内有超过190万例结直肠癌新发病例和超过93万例结直肠癌死亡病例。据观察,发病率和死亡率存在很大的地域差异。欧洲、澳大利亚和新西兰的发病率最高,东欧的死亡率最高。到2040年,结直肠癌负担将增加到每年320万例新发病例(增加63%%)和160万例死亡病例(增加73%%)。 在高收入国家,结直肠癌发病率一直在下降,主要原因在于有效的筛查规划。结直肠癌的预后因诊断分期而异。癌症早期的成活率高于癌症晚期。及时诊断、适当治疗和定期随访照护对于提高成活率和生活质量非常重要。', ' 结直肠癌在早期阶段通常没有症状。定期筛查对于及早发现该病并开始治疗很重要。 常见症状包括:', ' 可能增加患结直肠癌风险的因素包括:', ' 结直肠癌的诊断方法包括身体检查、影像学检查(如腹部超声、计算机断层扫描和磁共振成像)、使用结肠镜或乙状结肠镜检查结肠内部、采集组织样本(活检)进行组织病理学检查,以及进行分子检测以确定特定的基因突变或生物标志物,用以指导最佳治疗方案。', ' 结直肠癌的治疗依据是癌症类型和发展程度以及患者的病史。早期发现结直肠癌可以带来更好的治疗和结果。 治疗包括: 如果肿瘤尚未扩散到身体的其他部位,则通常在癌症早期阶段进行手术。化疗和放疗可以帮助缩小肿瘤。 来自多个学科的医生经常开展合作,为结直肠癌患者提供治疗和护理。 支持性护理对结直肠癌患者很重要。它旨在管理症状,缓解疼痛并提供情感支持。它可以帮助提高结直肠癌患者及其家人的生活质量。 早期疾病。早期结直肠癌(即肿瘤仅限于肠道或局部淋巴结,没有转移到远处器官)的主要治疗方法是手术切除肿瘤和附近的淋巴结。具体的外科手术取决于肿瘤的位置。这可能涉及结肠切除术(切除部分结肠)或直肠切除术(切除直肠)。在某些情况下,可能需要进行临时或永久性结肠造口术或回肠造口术,制造开口以排泄粪便。辅助治疗是指手术后给予的补充治疗,以降低癌症复发的风险。对于早期结直肠癌,可建议使用辅助化疗来消灭任何在手术过程中无法看到或切除的残留癌细胞。对于复发风险较高的患者,例如淋巴结受累或表现出某些肿瘤特征的患者,通常建议使用辅助化疗。有时可在手术前进行化疗(新辅助化疗)以缩小肿瘤。放射治疗可针对肠道最后一段(直肠)的肿瘤,以增加肿瘤缩小的机会。 治疗后,定期随访和监测对于发现任何复发或新发癌症的迹象至关重要。监测可包括身体检查、血液检测和影像学检查(如计算机断层扫描),以便在早期发现任何潜在复发。 晚期疾病。全身性治疗是转移性结直肠癌的主要治疗方法,因为它针对的是全身的癌细胞。化疗通常被用作转移性结直肠癌的一线治疗方法。联合化疗方案通常用于杀死癌细胞或减缓其生长。对于有特定基因突变(例如KRAS或BRAF基因突变)的患者,靶向治疗可与化疗结合使用。对于肿瘤中有特定遗传标志物(例如微卫星高度不稳定性(MSI-H)或错配修复缺陷(dMMR))的患者,可考虑使用免疫治疗药物。 在某些情况下,可建议对转移性结直肠癌患者进行手术,以切除引起症状或阻塞肠道的肿瘤。局部治疗(如射频消融、冷冻消融或放射治疗)可用于治疗特定部位转移,如肝转移。放射治疗可用于帮助控制疾病和管理症状,如疼痛或出血。'); +INSERT INTO `cancer_information` VALUES ('肺癌', ' 肺癌是全世界癌症相关死亡的主要原因,男性和女性的死亡率均为最高。 吸烟是肺癌的主要原因,约占所有病例的85%%。 肺癌常常在治疗选择有限的晚期才被诊断出来。 筛查高危个体有可能及早发现病例并显著提高存活率。 一级预防(如烟草控制措施和减少接触环境风险因素)可以降低肺癌的发病率并挽救生命。', ' 肺癌是当异常细胞在肺部以不受控制的方式生长时开始的一种癌症。它是一个严重的健康问题,可以导致严重的伤害和死亡。 肺癌的症状包括不消停的咳嗽、胸痛和呼吸急促。 尽早就医以避免严重的健康影响非常重要。治疗取决于患者的病史和疾病的阶段。 最常见的肺癌类型是非小细胞癌(NSCLC)和小细胞癌(SCLC)。非小细胞癌更常见且生长缓慢,而小细胞癌不太常见,但常常生长迅速。 肺癌是一个重大的公共卫生问题,在全球造成大量死亡。国际癌症研究机构(IARC)对癌症发病率和死亡率的GLOBOCAN(全球癌症观察站)2020年估计显示,肺癌仍然是癌症死亡的主要原因,2020年估计造成180万人死亡(18%%)。 吸烟(包括香烟、雪茄和烟斗)是肺癌的主要高危因素,但也可以影响非吸烟者。其他高危因素包括接触二手烟、职业危害(如石棉、氡和某些化学品)、空气污染、遗传性癌症综合征和以前的慢性肺部疾病。', ' 肺癌可以引起若干症状,可能表明肺部有问题。 最常见的症状包括: 早期症状可能较轻或被视为常见的呼吸系统问题,导致诊断延迟。', ' 不吸烟是预防肺癌的最佳方法。 应避免的其它高危因素包括: 早期治疗可以防止肺癌恶化并扩散到身体的其他部位。 肺癌的预防包括一级和二级预防措施。一级预防旨在通过降低风险和促进健康行为来预防疾病的最初发生。在公共卫生方面,这些预防措施包括戒烟,促进无烟环境,实施烟草控制政策,应对职业危害和降低空气污染水平。 肺癌的二级预防包括筛查,以便在症状变得明显之前的早期阶段发现疾病,并且可以适用于高风险个体。在这一人群中,早期发现可以显著增加成功治疗的机会并改善结果。肺癌的主要筛查方法是低剂量计算机断层扫描(LDCT)。', ' 肺癌的诊断方法包括身体检查、影像学检查(如胸部X线检查、计算机断层扫描和磁共振成像)、使用支气管镜检查肺的内部、采集组织样本(活检)进行组织病理学检查和确定具体亚型(NSCLC或SCLC),以及分子检测以确定特定的基因突变或生物标志物,用以指导最佳治疗方案。', ' 肺癌的治疗基于癌症的类型、扩散的程度以及患者的病史。早期发现肺癌可以带来更好的治疗和结果。 治疗包括: 如果肿瘤尚未扩散到身体的其他部位,则常常在肺癌的早期阶段使用手术。化疗和放疗可以帮助缩小肿瘤。 来自多个学科的医生经常开展合作,为肺癌患者提供治疗和护理。 支持性治疗对肺癌患者很重要。它旨在管理症状,缓解疼痛并提供情感支持。它有助于提高肺癌患者及其家人的生活质量。'); + +SET FOREIGN_KEY_CHECKS = 1; diff --git a/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/.gitignore b/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/.gitignore new file mode 100644 index 00000000..13566b81 --- /dev/null +++ b/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/.gitignore @@ -0,0 +1,8 @@ +# Default ignored files +/shelf/ +/workspace.xml +# Editor-based HTTP Client requests +/httpRequests/ +# Datasource local storage ignored files +/dataSources/ +/dataSources.local.xml diff --git a/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/Get_Cancer_Information.iml b/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/Get_Cancer_Information.iml new file mode 100644 index 00000000..d0876a78 --- /dev/null +++ b/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/Get_Cancer_Information.iml @@ -0,0 +1,8 @@ + + + + + + + + \ No newline at end of file diff --git a/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/inspectionProfiles/Project_Default.xml b/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/inspectionProfiles/Project_Default.xml new file mode 100644 index 00000000..4dca92bd --- /dev/null +++ b/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/inspectionProfiles/Project_Default.xml @@ -0,0 +1,14 @@ + + + + \ No newline at end of file diff --git a/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/inspectionProfiles/profiles_settings.xml b/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/inspectionProfiles/profiles_settings.xml new file mode 100644 index 00000000..105ce2da --- /dev/null +++ b/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/inspectionProfiles/profiles_settings.xml @@ -0,0 +1,6 @@ + + + + \ No newline at end of file diff --git a/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/misc.xml b/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/misc.xml new file mode 100644 index 00000000..d4b107a8 --- /dev/null +++ b/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/misc.xml @@ -0,0 +1,4 @@ + + + + \ No newline at end of file diff --git a/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/modules.xml b/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/modules.xml new file mode 100644 index 00000000..f9a4df48 --- /dev/null +++ b/src/medicine/癌症数据获取/Get_Cancer_Information/.idea/modules.xml @@ -0,0 +1,8 @@ + + + + + + + + \ No newline at end of file diff --git a/src/medicine/癌症数据获取/Get_Cancer_Information/spider/Get_Information.py b/src/medicine/癌症数据获取/Get_Cancer_Information/spider/Get_Information.py new file mode 100644 index 00000000..97a86d77 --- /dev/null +++ b/src/medicine/癌症数据获取/Get_Cancer_Information/spider/Get_Information.py @@ -0,0 +1,61 @@ +from html.parser import HTMLParser +import requests +from lxml import etree +import re +# xpath url +def Anaxpath(url , user , savepath): + path = "//*[@id=\"PageContent_T0643CD2A003_Col00\"]/article" +# url = "https://www.who.int/zh/news-room/fact-sheets/detail/breast-cancer" +# ua = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Safari/537.36 Edg/117.0.2045.47" + with requests.request('GET' , url , headers = {'User-agent':user}) as f: + content = f.text #获取HTML的内容 + html = etree.HTML(content) #分析HTML,返回DOM根节点 + res = html.xpath(path) + tree = etree.tostring(res[0],encoding='utf-8').decode('utf-8') + with open(savepath , 'w' , encoding="utf-8") as f1: + for j in tree: + f1.write(j) + f1.close() + f.close() + +def Analyse(htmlpath): + with open(htmlpath, 'r', encoding='utf-8') as f: + s = "" + for i in f: + s += i + + # 解析h2标题 + h2 = re.compile('

(.*?)

') + res_h2 = re.findall(h2, s) + res_h2.pop() + + p = re.compile('

(.*?)

') + res_p = re.findall(p, s) + j = 0 + res = [] + + for i in res_h2: + l = [i] + # 需要重新解析 + if "重要事实" in i: + x = re.compile('') + res_x = re.findall(x, s) + cnt = 1 + y = re.compile("(.*?)") + res_y = re.findall(y, res_x[0]) + while True: + if cnt - 1 >= len(res_y): + break + # l.append(str(cnt) + "、 " + res_y[cnt - 1]) + l.append(" " + res_y[cnt - 1]) + cnt += 1 + else: + res_p[j] = "

" + res_p[j] + z = re.compile("

(.*?)

") + res_z = re.findall(z, res_p[j]) + for w in range(1, len(res_z) + 1): + # l.append(str(w) + "、 " + res_z[w - 1]) + l.append(" " + res_z[w - 1]) + j += 1 + res.append(l) + return res \ No newline at end of file diff --git a/src/medicine/癌症数据获取/Get_Cancer_Information/spider/__pycache__/Get_Information.cpython-311.pyc b/src/medicine/癌症数据获取/Get_Cancer_Information/spider/__pycache__/Get_Information.cpython-311.pyc new file mode 100644 index 0000000000000000000000000000000000000000..3754472280a693f7296662b7d802e22dd71cfd53 GIT binary patch literal 3653 zcmbtXU2Gf25#Ht9@$UFfine|nIWpbalAGu+w(F*{5=OGD3bkv)?n6`=0>L{;R4I}^ zo+61j8Y)mUl*>d^s#a`Z1T^5dGHkehOHiOi5kI7T;{^ml93a3z>%@MeVFxh$)Y%is z(@Bb7x<}2pi)YRyt*p1ujp8WNCzqi618cV7i)Vg*E+i#I=`0KxQI&Slv_enUoJVO!CaBdm zP1iVuxd~{u>xgNqVl6PW)vdikZIfh8h}N2{!U{}tZGZ&p9rh-8al7tGVT&JiF_7Da z&dFY5Rj~-1j#!!88{c36bIrl zS&Yf!7rT!iePdv-H`v|%#`r)y+T9(v)D@ECNH{8L)ag?fQ?_41puG+%F&Uzbof1QW zC?zFwA1|0$dE)gGx3I>Ev2a|7#3nU7*J0N`0(S=5+tG@cXzlA4vG8a)fXXk0S%o~SF+I>i$j z8{XWHMo-BzQH_$sBv^#^LbFWtXm~nl2g7Yf`z`|G!8gYeQhYouAQTIW()iC} z6LD!KBu79knTWvA=&M_%I}-~U7mS7U?MeZ#OF}(42d~T`D%;;)9Q@9TY`zlTod03r z;Jv*7yI`3Cq z`%A9<8H%i5$%hLEu1%~@7Tw2H_wkbZ_}A`}U%5|yKB>BgO75Wyz2Wrc+VdCIPZym> zRp-%?^JoQ8eBK8lEY<>Z;kti%X?SstM(i`Wru5d`0DV|NOmMMQei=K{lGkm21wyp17Cr`*JJR`)I`(94B@G{Zl zakzkM!QO#m)EBO<0iOBdqyzZ-JU!s#?>i~Ndoba>jf6i&5B!9^--m&Q>xm8^NW#$5 zY!T=h+L~e^tzyA)huV=;u|TIS3WlV^rYXguP$?%uX-k%q>!}wZBkc;?(<^O~tLrGV zVlgM0G@~$udYT4L>ur0QG9lK}?2d$LHOU#4tvf8U0-NS0QJPnnL6pOn-h!P{lQ?Y? zIE8u-Ngtb#42!%u)u!zxIm4oThed~AOFK={2C97>v2pt=-?z#4^T+iALaq&Njz z3KG9ea!Iu*ZZrC?_0lKd*kQ$1sF$>wH0cGW;;tbX)>5!yMuLJs?2+hjX8U8m6I=?b zaAplM(+8TS9T_{{=3Clhk~4PhF(Yr=xmR`*zc-s;Gwt4M_8I&IF|$5I`oXmCC8yz4 ze4FQL-kTX2%I*&ou6iCE6yROYc4x89;cQUh!{iHVms0%FlIc0CVM&6oIV6!6T|+5X z-&AjZd*_k2I{LbROF8-y)gg@Zf;j5{$;a=1@aX1m{`0?9`6IQr z4@zDV`a3wOfjD51L{jHw5)mlP>_j9cgrZRD67hsaMWJF^ zLkTFHg2qUp*reFepmC%Yk_suc5Ph7~a743A^=eiqkK@qe1PBA0klH{%YSpEp8lK;r zp4X^wOxEzi=5Rs7sZA~=kyju|yfR8^os$j_92QDmbOFkBKaBPe@lz0)i)e#)W~TB~ zVY0|~s(fdO@2sH1OvAkcP+T&&?1c=E`39Y2f@Oy@=Up1g1T#S>k}gknwAj?HIy*|v zj*Ml)+pyY_f2V*|Z=mE2WUOV*wQRd;TXJL_8OKA1D?5_AqB;(h9EUP^!{b}E<$LlW z)zen;v}G8826HY?hI-(IlGVt!JRt;ZdVM)66MW!qEqIIW0Q@%mdsjz_uXd^a?vlSd zhc}v9uGtDbg^=3RUTSL3G3C9DIjSo4W7U76A`|{{m6|YUp2l~Y<#WU)cU}`XKnbS;rxZdvGs=a%eNYD^sB8ss=v47?=AX! z%l^iE&&qIapkfD*2TiRN8+zpc$a-&_Q1|^P$K*mQobE;bit6ty`8&VIiH+v{`O7uy z>zA*0s?9y6=AH_&csEHdxYZT!`uSUXZuF_G)dMK{yWv;%cys4htniiKa4(Ns9m!o@ zI+Hz82CMth6qUm5X>`ct8u7~;83_P1l$`%WUg19tugIN&XG literal 0 HcmV?d00001 diff --git a/src/medicine/癌症数据获取/Get_Cancer_Information/spider/use_code.ipynb b/src/medicine/癌症数据获取/Get_Cancer_Information/spider/use_code.ipynb new file mode 100644 index 00000000..c866b5e8 --- /dev/null +++ b/src/medicine/癌症数据获取/Get_Cancer_Information/spider/use_code.ipynb @@ -0,0 +1,1300 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "source": [ + "### *get请求测试*" + ], + "metadata": { + "collapsed": false + } + }, + { + "cell_type": "code", + "execution_count": 1, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "\n" + ] + } + ], + "source": [ + "import requests\n", + "\n", + "res = requests.get(\"https://www.who.int/zh/news-room/fact-sheets/detail/breast-cancer\")\n", + "print(res)" + ], + "metadata": { + "collapsed": false + } + }, + { + "cell_type": "code", + "execution_count": 3, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + " \r\n", + "\t乳腺癌\r\n", + " \n", + "
\n", + "
\n", + "
\n", + "
\n", + "
\n", + "\n", + "
\n", + "
\n", + "
\n", + "
\n", + "
\n", + "\n", + "\n", + "\n", + "\n", + "
\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "
\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "
\n", + "
\n", + "\n", + "\n", + "\n", + "\n", + "
\n", + "\n", + "
\n", + "
\n", + "
\n", + "
\n", + "
\n", + "
\n", + "
\n", + "
\n", + "
\n", + "
\n", + "
\n", + "
\n", + "
\n", + "
\n", + "
\n", + "\n", + "
    \n", + "\n", + "
    \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "\n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
        \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
        \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
        \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
        \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "\n", + "
      \n", + "\n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "世卫组织/B. Anderson\n", + "
      \n", + "
      \n", + "
      \n", + "©\n", + "来源\n", + "\n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "

      乳腺癌

      \n", + "
      \n", + "2021年3月26日\n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "

      概述

      乳腺癌发生在乳腺导管衬细胞(上皮)(85%)或乳腺腺体组织的小叶(15%)里。最开始时,癌细胞生长局限于导管或小叶里(“原位”),通常不会出现症状,扩散(转移)的可能性极小。

      随着时间的推移,这些原位(0期)癌细胞可能会逐渐发展并侵袭周围的乳腺组织(侵袭性乳腺癌),然后扩散到附近的淋巴结(特定区域性转移)或体内的其他器官(远处转移)。如果一个女人死于乳腺癌,那是因为出现了广泛的转移。

      乳腺癌的治疗可能非常有效,尤其是在早发现这种疾病的时候。乳腺癌的治疗通常包括手术切除、放射治疗和药物治疗(激素治疗、化疗和/或靶向生物治疗)相结合,以治疗从乳腺肿瘤通过血液扩散的微小癌症。这种治疗可以防止恶性肿瘤的生长和扩散,从而挽救生命。

      问题的范围

      2020年,全球有230万名妇女被诊断患有乳腺癌,有68.5万人死亡。截至2020年底,在过去五年里,共有780万名在世妇女被诊断患有乳腺癌,使其成为世界上最常见的癌症。在全球范围内,女性因乳腺癌而损失的残疾调整生命年数比任何其他类型的癌症都多。世界上每个国家的妇女在青春期之后的任何年龄都会发生乳腺癌,但在晚年的发病率会越来越高。

      从20世纪30年代到70年代,乳腺癌死亡率变化不大。存活率的提高始于20世纪80年代,各国开始将早发现规划与不同治疗模式结合起来,以达到根除侵袭性疾病的目的。

      谁有风险?

      乳腺癌不是一种传染病。与人乳头瘤病毒感染和宫颈癌等与感染有关的一些癌症不同,没有已知的病毒和细菌感染与乳腺癌形成有关联。

      约有一半的乳腺癌发生在除了性别(女性)和年龄(40岁以上)以外没有其他可识别乳腺癌风险因素的妇女当中。某些因素会增加患乳腺癌的风险,包括年龄增长、肥胖、有害使用酒精、乳腺癌家族史、辐射暴露史、生殖史(如月经开始的年龄和首次怀孕的年龄)、使用烟草和绝经后激素治疗。

      降低乳腺癌风险的行为选择和相关干预措施包括:

      • 长期坚持母乳喂养;
      • 经常参加体育锻炼;
      • 控制体重;
      • 避免有害使用酒精;
      • 避免暴露于烟草烟雾之下;
      • 避免长期使用激素;和
      • 避免暴露于过量辐射之下。

      不幸的是,即使所有潜在可变风险因素都可以控制,也只能将患乳腺癌的风险最多降低30%。

      女性的性别是最强的乳腺癌风险因素。约有0.5%至1%的乳腺癌发生在男性身上。男性乳腺癌治疗应遵循与女性相同的管理原则。

      乳腺癌家族史增加了乳腺癌的风险,但大多数被诊断为患有乳腺癌的妇女没有已知的乳腺癌家族史。没有已知的家族史未必意味着女性患有乳腺癌的风险降低。

      某些遗传的“高外显率”基因突变大大增加了乳腺癌风险,最主要的是BRCA1、BRCA2和PALB-2基因的突变。被发现这些主要基因中存在突变的女性可以考虑采用手术切除双乳房等降低风险的策略。考虑采用这种高度侵入性方法的患者只涉及非常有限的妇女,应仔细评估,并且应考虑所有替代方案,不应仓促行事。

      体征和症状

      乳腺癌最常见的表现是乳房出现无痛性肿块或增厚。重要的是,妇女发现乳房有异常肿块时,即使没有与之相关的疼痛,也应立即就医,不得拖延超过1至2个月。在出现潜在症状的初步体征时就医可以获得更成功的治疗。

      一般来说,乳腺癌的症状包括:

      • 乳房出现肿块或增厚;
      • 乳房大小、形状或外观出现变化;
      • 皮肤出现凹陷、发红、蚀损斑或其他变化;
      • 乳头外观出现变化或乳头周围皮肤(乳晕)出现变化;和/或
      • 乳头出现异常分泌物。

      乳房出现肿块的原因有很多,大部分不是癌症。多达90%的乳房肿块不是恶性肿瘤。非癌症乳房异常包括纤维腺瘤和囊肿等良性肿块以及感染。

      乳腺癌可以以多种形式出现,这就是为什么进行全面的医学检查很重要的原因。出现持续性乳房异常(通常持续一个月以上)的妇女应接受包括乳房成像在内的检查,在有些情况下,还应进行组织取样(活检),以确定肿块是恶性的(恶性肿瘤),还是良性的。

      癌症晚期可能会损害皮肤,导致开放性伤口(溃疡),但不一定疼痛。有乳房伤口不愈情形的妇女应进行活检。

      乳腺癌可能会扩散到身体的其他部位,并引发其他症状。通常情况下,尽管可能有无法感觉到的淋巴结恶性肿瘤,但最先可以检测到的最常见的扩散部位是手臂下的淋巴结。

      随着时间的推移,恶性肿瘤可能会扩散到包括肺、肝、脑和骨骼在内的其他器官。一旦它们到达这些部位,就可能会出现骨痛或头痛等新的与癌症相关的症状。

      治疗

      乳腺癌治疗可能非常有效,达到90%或更高的存活率,特别是在及早发现这种疾病时。治疗通常包括旨在控制乳房、淋巴结和周围区域疾病的手术和放射治疗(局部控制)以及旨在治疗和/或降低恶性肿瘤扩散(转移)风险的全身治疗(口服或静脉注射抗癌药物)。抗癌药物包括内分泌(激素)疗法、化疗以及在某些情况下的靶向生物疗法(抗体)。

      在过去,所有乳腺癌都是通过乳房切除术(完全切除乳房)进行手术治疗。当恶性肿瘤很大时,可能仍然需要采用乳房切除术。目前,大多数乳腺癌可以采用一种叫做“乳房肿瘤切除术”或乳房部分切除术的较小手术来治疗,在这种手术中,只从乳房中切除肿瘤。在此情况下,通常需要对乳房进行放射治疗,以尽量减少乳房中恶性肿瘤复发的机会。

      在对侵袭性恶性肿瘤实行癌症手术时,淋巴结会被切除。在过去,完全切除腋下淋巴结(完全切除腋窝淋巴结)被认为是防止恶性肿瘤扩散的必要措施。现在,一种叫做“前哨淋巴结活检”的较小淋巴结手术更受欢迎,因为它的并发症较少。它使用染色示踪剂和/或放射性示踪剂来寻找恶性肿瘤可能从乳房扩散的最初几个淋巴结。

      乳腺癌的药物治疗可以在手术前(“新辅助治疗”)或手术后(“辅助治疗”)进行,这取决于癌症的生物学分亚型。表达雌激素受体(ER)和/或孕酮受体(PR)的恶性肿瘤可能对他莫昔芬或芳香酶抑制剂等内分泌(激素)疗法产生反应。口服这些药物五至十年会将这些“激素阳性”恶性肿瘤的复发几率降低近一半。内分泌疗法可能导致出现更年期症状,但通常耐受性良好。

      不表达雌激素受体或孕酮受体的恶性肿瘤属于“激素受体阴性”,除非恶性肿瘤很小,否则需要进行化疗。目前可用的化疗方案在减少癌细胞扩散或复发的机会方面非常有效,通常作为门诊治疗手段。在没有并发症的情况下,乳腺癌的化疗通常不需要住院。

      乳腺癌可能会独自过度表达一种叫做HER-2/neu癌基因的分子。这些“HER-2阳性”恶性肿瘤可以用曲妥珠单抗等靶向生物制剂进行治疗。这些生物制剂非常有效,但也非常昂贵,因为它们是抗体,而不是化学品。在实施靶向生物治疗时,与化疗结合会使它们能够有效地杀死癌细胞。

      在乳腺癌的治疗中,放射治疗也起着非常重要的作用。对于早期乳腺癌而言,放射治疗可以防止妇女不得不实行乳房切除术。对于后期癌症而言,即使已经实行了乳房切除术,放射治疗也可降低癌症复发的风险。对于晚期乳腺癌而言,在某些情况下,放射治疗可以降低死于这种疾病的可能性。

      乳腺癌治疗的有效性取决于整个治疗过程。局部治疗不太可能取得积极的治疗结果。

      挑战

      在高收入国家,乳腺癌确诊后至少5年的存活率超过90%,印度为66%,南非为40%。在高收入国家,早发现和早治疗已被证明是成功的,应在资源有限但有一些标准工具可用的国家采用这一方法。用于治疗乳腺癌的绝大多数药物已被列入世卫组织基本药物清单。因此,全球在治疗乳腺癌方面的重大改进可以通过实施我们已经知道有效的措施来实现。

      全球影响

      从20世纪80年代到2020年,高收入国家的年龄标准化乳腺癌死亡率下降了40%。已经成功降低乳腺癌死亡率的国家已经能够实现乳腺癌死亡率每年下降2%至4%的目标。如果全球死亡率每年下降2.5%,则将会在2020至2040年期间减少乳腺癌死亡250万人。

      改善乳腺癌预后的策略取决于为提供已知有效的治疗方法而加强基础卫生系统的情况。这些工作对于治疗其他癌症和其他非恶性非传染性疾病也很重要。例如,拥有从初级保健机构向地区医院和专门的肿瘤治疗中心的可靠转诊途径。

      建立从初级保健机构向地区医院和专门的肿瘤治疗中心的可靠转诊途径需要的管理方法与宫颈癌、肺癌、结肠直肠癌和前列腺癌相同。为此,乳腺癌是一种“标志性”疾病,为其建立的转诊途径也可用于管理其他疾病。

      世卫组织应对

      世卫组织全球乳腺癌行动(GBCI)的目标是让全球乳腺癌死亡率每年下降2.5%,从而在2020至2040年期间在全球范围内减少乳腺癌死亡250万人。全球乳腺癌死亡率每年下降2.5%,到2030年乳腺癌死亡减少25%,到2040年70岁以下女性乳腺癌死亡率减少40%。实现这些目标的三大支柱是:早发现,促进健康;及时诊断;和全面的乳腺癌管理。

      通过开展公共卫生教育活动,提高妇女对乳腺癌体征和症状的认识,并与她们的家人们一起了解早发现和早治疗的重要性,让更多的妇女在首次怀疑患有乳腺癌时以及在任何现有癌症进入晚期之前就能就诊。即使没有乳房X光筛查,也可以做到这一点,目前,很多国家尚无法开展这种筛查。

      需要将公共教育与卫生工作者教育结合起来,让他们了解早期乳腺癌的体征和症状,以便在适当时能够将妇女转诊到诊断机构。需要将快速诊断与有效的癌症治疗联系起来,在很多情况下,癌症治疗需要一定程度的专业癌症护理。通过在癌症治疗机构或医院建立集中化服务,以乳腺癌作为一种模式,可以在改善其他癌症管理的同时优化乳腺癌治疗。


      (1) 年龄标准化是一种用于在人口年龄分布存在很大差异时进行人口比较的技术。

      参考文献

      1. DeSantis CE, Bray F, Ferlay J, Lortet-Tieulent J, Anderson BO, Jemal A. International Variation in Female Breast Cancer Incidence and Mortality Rates. Cancer Epidemiol Biomarkers Prev. 2015; 24(10): 1495-506. http://www.ncbi.nlm.nih.gov/pubmed/26359465
      2. Stoltenberg M, Spence D, Daubman BR, Greaves N, Edwards R, Bromfield B, et al. The central role of provider training in implementing resource-stratified guidelines for palliative care in low-income and middle-income countries: Lessons from the Jamaica Cancer Care and Research Institute in the Caribbean and Universidad Catolica in Latin America. Cancer. 2020; 126 Suppl 10: 2448-57. http://www.ncbi.nlm.nih.gov/pubmed/32348569
      3. Ginsburg O, Yip CH, Brooks A, Cabanes A, Caleffi M, Dunstan Yataco JA, et al. Breast cancer early detection: A phased approach to implementation. Cancer. 2020; 126 Suppl 10: 2379-93. http://www.ncbi.nlm.nih.gov/pubmed/32348566
      4. Mutebi M, Anderson BO, Duggan C, Adebamowo C, Agarwal G, Ali Z, et al. Breast cancer treatment: A phased approach to implementation. Cancer. 2020; 126 Suppl 10: 2365-78. http://www.ncbi.nlm.nih.gov/pubmed/32348571
      5. Velazquez Berumen A, Jimenez Moyao G, Rodriguez NM, Ilbawi AM, Migliore A, Shulman LN. Defining priority medical devices for cancer management: a WHO initiative. Lancet Oncol. 2018; 19(12): e709-e19. http://www.ncbi.nlm.nih.gov/pubmed/30507437
      6. Ilbawi AM, Velazquez-Berumen A. World Health Organization List of Priority Medical Devices for Cancer Management to Promote Universal Coverage. Clin Lab Med. 2018; 38(1): 151-60. http://www.ncbi.nlm.nih.gov/pubmed/29412879
      7. McCormack V, McKenzie F, Foerster M, Zietsman A, Galukande M, Adisa C, et al. Breast cancer survival and survival gap apportionment in sub-Saharan Africa (ABC-DO): a prospective cohort study. The Lancet Global health. 2020; 8(9): e1203-e12. http://www.ncbi.nlm.nih.gov/pubmed/32827482
      8. Rositch AF, Unger-Saldana K, DeBoer RJ, Ng'ang'a A, Weiner BJ. The role of dissemination and implementation science in global breast cancer control programs: Frameworks, methods, and examples. Cancer. 2020; 126 Suppl 10: 2394-404. http://www.ncbi.nlm.nih.gov/pubmed/32348574
      9. Wild CP, Weiderpass E, Stewart BW, editors (2020). World Cancer Report: Cancer Research for Cancer Prevention. Lyon, France: International Agency for Research on Cancer. Available from: http://publications.iarc.fr/586

       

      \n", + "
      \n", + "
      \n", + "\n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "
      \n", + "\n" + ] + } + ], + "source": [ + "print(res.text)" + ], + "metadata": { + "collapsed": false + } + }, + { + "cell_type": "code", + "execution_count": 15, + "outputs": [], + "source": [ + "with open('page.txt' , 'w' , encoding = 'utf8') as f:\n", + " f.write(res.text)" + ], + "metadata": { + "collapsed": false + } + }, + { + "cell_type": "code", + "execution_count": 4, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[] []\n" + ] + } + ], + "source": [ + "import requests\n", + "import re\n", + "\n", + "url = \"https://www.who.int/zh/news-room/fact-sheets/detail/breast-cancer\"\n", + "patten = re.compile('

      (.*?)

      ')\n", + "patten1 = re.compile('

      (.*?)

      ')\n", + "title = re.findall(patten , url)\n", + "context = re.findall(patten1 , url)\n", + "\n", + "print(title , context)" + ], + "metadata": { + "collapsed": false + } + }, + { + "cell_type": "code", + "execution_count": 13, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "乳腺癌发生在乳腺导管衬细胞(上皮)(85%)或乳腺腺体组织的小叶(15%)里。最开始时,癌细胞生长局限于导管或小叶里(“原位”),通常不会出现症状,扩散(转移)的可能性极小。\n", + "\n", + "随着时间的推移,这些原位(0期)癌细胞可能会逐渐发展并侵袭周围的乳腺组织(侵袭性乳腺癌),然后扩散到附近的淋巴结(特定区域性转移)或体内的其他器官(远处转移)。如果一个女人死于乳腺癌,那是因为出现了广泛的转移。\n", + "\n", + "乳腺癌的治疗可能非常有效,尤其是在早发现这种疾病的时候。乳腺癌的治疗通常包括手术切除、放射治疗和药物治疗(激素治疗、化疗和/或靶向生物治疗)相结合,以治疗从乳腺肿瘤通过血液扩散的微小癌症。这种治疗可以防止恶性肿瘤的生长和扩散,从而挽救生命。\n", + "\n", + "2020年,全球有230万名妇女被诊断患有乳腺癌,有68.5万人死亡。截至2020年底,在过去五年里,共有780万名在世妇女被诊断患有乳腺癌,使其成为世界上最常见的癌症。在全球范围内,女性因乳腺癌而损失的残疾调整生命年数比任何其他类型的癌症都多。世界上每个国家的妇女在青春期之后的任何年龄都会发生乳腺癌,但在晚年的发病率会越来越高。\n", + "\n", + "从20世纪30年代到70年代,乳腺癌死亡率变化不大。存活率的提高始于20世纪80年代,各国开始将早发现规划与不同治疗模式结合起来,以达到根除侵袭性疾病的目的。\n", + "\n", + "乳腺癌不是一种传染病。与人乳头瘤病毒感染和宫颈癌等与感染有关的一些癌症不同,没有已知的病毒和细菌感染与乳腺癌形成有关联。\n", + "\n", + "约有一半的乳腺癌发生在除了性别(女性)和年龄(40岁以上)以外没有其他可识别乳腺癌风险因素的妇女当中。某些因素会增加患乳腺癌的风险,包括年龄增长、肥胖、有害使用酒精、乳腺癌家族史、辐射暴露史、生殖史(如月经开始的年龄和首次怀孕的年龄)、使用烟草和绝经后激素治疗。\n", + "\n", + "降低乳腺癌风险的行为选择和相关干预措施包括:\n", + "\n", + "不幸的是,即使所有潜在可变风险因素都可以控制,也只能将患乳腺癌的风险最多降低30%。\n", + "\n", + "女性的性别是最强的乳腺癌风险因素。约有0.5%至1%的乳腺癌发生在男性身上。男性乳腺癌治疗应遵循与女性相同的管理原则。\n", + "\n", + "乳腺癌家族史增加了乳腺癌的风险,但大多数被诊断为患有乳腺癌的妇女没有已知的乳腺癌家族史。没有已知的家族史未必意味着女性患有乳腺癌的风险降低。\n", + "\n", + "某些遗传的“高外显率”基因突变大大增加了乳腺癌风险,最主要的是BRCA1、BRCA2和PALB-2基因的突变。被发现这些主要基因中存在突变的女性可以考虑采用手术切除双乳房等降低风险的策略。考虑采用这种高度侵入性方法的患者只涉及非常有限的妇女,应仔细评估,并且应考虑所有替代方案,不应仓促行事。\n", + "\n", + "乳腺癌最常见的表现是乳房出现无痛性肿块或增厚。重要的是,妇女发现乳房有异常肿块时,即使没有与之相关的疼痛,也应立即就医,不得拖延超过1至2个月。在出现潜在症状的初步体征时就医可以获得更成功的治疗。\n", + "\n", + "一般来说,乳腺癌的症状包括:\n", + "\n", + "乳房出现肿块的原因有很多,大部分不是癌症。多达90%的乳房肿块不是恶性肿瘤。非癌症乳房异常包括纤维腺瘤和囊肿等良性肿块以及感染。\n", + "\n", + "乳腺癌可以以多种形式出现,这就是为什么进行全面的医学检查很重要的原因。出现持续性乳房异常(通常持续一个月以上)的妇女应接受包括乳房成像在内的检查,在有些情况下,还应进行组织取样(活检),以确定肿块是恶性的(恶性肿瘤),还是良性的。\n", + "\n", + "癌症晚期可能会损害皮肤,导致开放性伤口(溃疡),但不一定疼痛。有乳房伤口不愈情形的妇女应进行活检。\n", + "\n", + "乳腺癌可能会扩散到身体的其他部位,并引发其他症状。通常情况下,尽管可能有无法感觉到的淋巴结恶性肿瘤,但最先可以检测到的最常见的扩散部位是手臂下的淋巴结。\n", + "\n", + "随着时间的推移,恶性肿瘤可能会扩散到包括肺、肝、脑和骨骼在内的其他器官。一旦它们到达这些部位,就可能会出现骨痛或头痛等新的与癌症相关的症状。\n", + "\n", + "乳腺癌治疗可能非常有效,达到90%或更高的存活率,特别是在及早发现这种疾病时。治疗通常包括旨在控制乳房、淋巴结和周围区域疾病的手术和放射治疗(局部控制)以及旨在治疗和/或降低恶性肿瘤扩散(转移)风险的全身治疗(口服或静脉注射抗癌药物)。抗癌药物包括内分泌(激素)疗法、化疗以及在某些情况下的靶向生物疗法(抗体)。\n", + "\n", + "在过去,所有乳腺癌都是通过乳房切除术(完全切除乳房)进行手术治疗。当恶性肿瘤很大时,可能仍然需要采用乳房切除术。目前,大多数乳腺癌可以采用一种叫做“乳房肿瘤切除术”或乳房部分切除术的较小手术来治疗,在这种手术中,只从乳房中切除肿瘤。在此情况下,通常需要对乳房进行放射治疗,以尽量减少乳房中恶性肿瘤复发的机会。\n", + "\n", + "在对侵袭性恶性肿瘤实行癌症手术时,淋巴结会被切除。在过去,完全切除腋下淋巴结(完全切除腋窝淋巴结)被认为是防止恶性肿瘤扩散的必要措施。现在,一种叫做“前哨淋巴结活检”的较小淋巴结手术更受欢迎,因为它的并发症较少。它使用染色示踪剂和/或放射性示踪剂来寻找恶性肿瘤可能从乳房扩散的最初几个淋巴结。\n", + "\n", + "乳腺癌的药物治疗可以在手术前(“新辅助治疗”)或手术后(“辅助治疗”)进行,这取决于癌症的生物学分亚型。表达雌激素受体(ER)和/或孕酮受体(PR)的恶性肿瘤可能对他莫昔芬或芳香酶抑制剂等内分泌(激素)疗法产生反应。口服这些药物五至十年会将这些“激素阳性”恶性肿瘤的复发几率降低近一半。内分泌疗法可能导致出现更年期症状,但通常耐受性良好。\n", + "\n", + "不表达雌激素受体或孕酮受体的恶性肿瘤属于“激素受体阴性”,除非恶性肿瘤很小,否则需要进行化疗。目前可用的化疗方案在减少癌细胞扩散或复发的机会方面非常有效,通常作为门诊治疗手段。在没有并发症的情况下,乳腺癌的化疗通常不需要住院。\n", + "\n", + "乳腺癌可能会独自过度表达一种叫做HER-2/neu癌基因的分子。这些“HER-2阳性”恶性肿瘤可以用曲妥珠单抗等靶向生物制剂进行治疗。这些生物制剂非常有效,但也非常昂贵,因为它们是抗体,而不是化学品。在实施靶向生物治疗时,与化疗结合会使它们能够有效地杀死癌细胞。\n", + "\n", + "在乳腺癌的治疗中,放射治疗也起着非常重要的作用。对于早期乳腺癌而言,放射治疗可以防止妇女不得不实行乳房切除术。对于后期癌症而言,即使已经实行了乳房切除术,放射治疗也可降低癌症复发的风险。对于晚期乳腺癌而言,在某些情况下,放射治疗可以降低死于这种疾病的可能性。\n", + "\n", + "乳腺癌治疗的有效性取决于整个治疗过程。局部治疗不太可能取得积极的治疗结果。 \n", + "\n", + "在高收入国家,乳腺癌确诊后至少5年的存活率超过90%,印度为66%,南非为40%。在高收入国家,早发现和早治疗已被证明是成功的,应在资源有限但有一些标准工具可用的国家采用这一方法。用于治疗乳腺癌的绝大多数药物已被列入世卫组织基本药物清单。因此,全球在治疗乳腺癌方面的重大改进可以通过实施我们已经知道有效的措施来实现。\n", + "\n", + "从20世纪80年代到2020年,高收入国家的年龄标准化乳腺癌死亡率下降了40%。已经成功降低乳腺癌死亡率的国家已经能够实现乳腺癌死亡率每年下降2%至4%的目标。如果全球死亡率每年下降2.5%,则将会在2020至2040年期间减少乳腺癌死亡250万人。\n", + "\n", + "改善乳腺癌预后的策略取决于为提供已知有效的治疗方法而加强基础卫生系统的情况。这些工作对于治疗其他癌症和其他非恶性非传染性疾病也很重要。例如,拥有从初级保健机构向地区医院和专门的肿瘤治疗中心的可靠转诊途径。\n", + "\n", + "建立从初级保健机构向地区医院和专门的肿瘤治疗中心的可靠转诊途径需要的管理方法与宫颈癌、肺癌、结肠直肠癌和前列腺癌相同。为此,乳腺癌是一种“标志性”疾病,为其建立的转诊途径也可用于管理其他疾病。\n", + "\n", + "世卫组织全球乳腺癌行动(GBCI)的目标是让全球乳腺癌死亡率每年下降2.5%,从而在2020至2040年期间在全球范围内减少乳腺癌死亡250万人。全球乳腺癌死亡率每年下降2.5%,到2030年乳腺癌死亡减少25%,到2040年70岁以下女性乳腺癌死亡率减少40%。实现这些目标的三大支柱是:早发现,促进健康;及时诊断;和全面的乳腺癌管理。\n", + "\n", + "通过开展公共卫生教育活动,提高妇女对乳腺癌体征和症状的认识,并与她们的家人们一起了解早发现和早治疗的重要性,让更多的妇女在首次怀疑患有乳腺癌时以及在任何现有癌症进入晚期之前就能就诊。即使没有乳房X光筛查,也可以做到这一点,目前,很多国家尚无法开展这种筛查。\n", + "\n", + "需要将公共教育与卫生工作者教育结合起来,让他们了解早期乳腺癌的体征和症状,以便在适当时能够将妇女转诊到诊断机构。需要将快速诊断与有效的癌症治疗联系起来,在很多情况下,癌症治疗需要一定程度的专业癌症护理。通过在癌症治疗机构或医院建立集中化服务,以乳腺癌作为一种模式,可以在改善其他癌症管理的同时优化乳腺癌治疗。\n", + "\n", + "
      \n", + "\n", + "(1) 年龄标准化是一种用于在人口年龄分布存在很大差异时进行人口比较的技术。\n", + "\n", + " \n", + "\n", + "乳腺癌发生在乳腺导管衬细胞(上皮)(85%)或乳腺腺体组织的小叶(15%)里。最开始时,癌细胞生长局限于导管或小叶里(“原位”),通常不会出现症状,扩散(转移)的可能性极小。\n", + "\n", + "随着时间的推移,这些原位(0期)癌细胞可能会逐渐发展并侵袭周围的乳腺组织(侵袭性乳腺癌),然后扩散到附近的淋巴结(特定区域性转移)或体内的其他器官(远处转移)。如果一个女人死于乳腺癌,那是因为出现了广泛的转移。\n", + "\n", + "乳腺癌的治疗可能非常有效,尤其是在早发现这种疾病的时候。乳腺癌的治疗通常包括手术切除、放射治疗和药物治疗(激素治疗、化疗和/或靶向生物治疗)相结合,以治疗从乳腺肿瘤通过血液扩散的微小癌症。这种治疗可以防止恶性肿瘤的生长和扩散,从而挽救生命。\n", + "\n", + "2020年,全球有230万名妇女被诊断患有乳腺癌,有68.5万人死亡。截至2020年底,在过去五年里,共有780万名在世妇女被诊断患有乳腺癌,使其成为世界上最常见的癌症。在全球范围内,女性因乳腺癌而损失的残疾调整生命年数比任何其他类型的癌症都多。世界上每个国家的妇女在青春期之后的任何年龄都会发生乳腺癌,但在晚年的发病率会越来越高。\n", + "\n", + "从20世纪30年代到70年代,乳腺癌死亡率变化不大。存活率的提高始于20世纪80年代,各国开始将早发现规划与不同治疗模式结合起来,以达到根除侵袭性疾病的目的。\n", + "\n", + "乳腺癌不是一种传染病。与人乳头瘤病毒感染和宫颈癌等与感染有关的一些癌症不同,没有已知的病毒和细菌感染与乳腺癌形成有关联。\n", + "\n", + "约有一半的乳腺癌发生在除了性别(女性)和年龄(40岁以上)以外没有其他可识别乳腺癌风险因素的妇女当中。某些因素会增加患乳腺癌的风险,包括年龄增长、肥胖、有害使用酒精、乳腺癌家族史、辐射暴露史、生殖史(如月经开始的年龄和首次怀孕的年龄)、使用烟草和绝经后激素治疗。\n", + "\n", + "降低乳腺癌风险的行为选择和相关干预措施包括:\n", + "\n", + "不幸的是,即使所有潜在可变风险因素都可以控制,也只能将患乳腺癌的风险最多降低30%。\n", + "\n", + "女性的性别是最强的乳腺癌风险因素。约有0.5%至1%的乳腺癌发生在男性身上。男性乳腺癌治疗应遵循与女性相同的管理原则。\n", + "\n", + "乳腺癌家族史增加了乳腺癌的风险,但大多数被诊断为患有乳腺癌的妇女没有已知的乳腺癌家族史。没有已知的家族史未必意味着女性患有乳腺癌的风险降低。\n", + "\n", + "某些遗传的“高外显率”基因突变大大增加了乳腺癌风险,最主要的是BRCA1、BRCA2和PALB-2基因的突变。被发现这些主要基因中存在突变的女性可以考虑采用手术切除双乳房等降低风险的策略。考虑采用这种高度侵入性方法的患者只涉及非常有限的妇女,应仔细评估,并且应考虑所有替代方案,不应仓促行事。\n", + "\n", + "乳腺癌最常见的表现是乳房出现无痛性肿块或增厚。重要的是,妇女发现乳房有异常肿块时,即使没有与之相关的疼痛,也应立即就医,不得拖延超过1至2个月。在出现潜在症状的初步体征时就医可以获得更成功的治疗。\n", + "\n", + "一般来说,乳腺癌的症状包括:\n", + "\n", + "乳房出现肿块的原因有很多,大部分不是癌症。多达90%的乳房肿块不是恶性肿瘤。非癌症乳房异常包括纤维腺瘤和囊肿等良性肿块以及感染。\n", + "\n", + "乳腺癌可以以多种形式出现,这就是为什么进行全面的医学检查很重要的原因。出现持续性乳房异常(通常持续一个月以上)的妇女应接受包括乳房成像在内的检查,在有些情况下,还应进行组织取样(活检),以确定肿块是恶性的(恶性肿瘤),还是良性的。\n", + "\n", + "癌症晚期可能会损害皮肤,导致开放性伤口(溃疡),但不一定疼痛。有乳房伤口不愈情形的妇女应进行活检。\n", + "\n", + "乳腺癌可能会扩散到身体的其他部位,并引发其他症状。通常情况下,尽管可能有无法感觉到的淋巴结恶性肿瘤,但最先可以检测到的最常见的扩散部位是手臂下的淋巴结。\n", + "\n", + "随着时间的推移,恶性肿瘤可能会扩散到包括肺、肝、脑和骨骼在内的其他器官。一旦它们到达这些部位,就可能会出现骨痛或头痛等新的与癌症相关的症状。\n", + "\n", + "乳腺癌治疗可能非常有效,达到90%或更高的存活率,特别是在及早发现这种疾病时。治疗通常包括旨在控制乳房、淋巴结和周围区域疾病的手术和放射治疗(局部控制)以及旨在治疗和/或降低恶性肿瘤扩散(转移)风险的全身治疗(口服或静脉注射抗癌药物)。抗癌药物包括内分泌(激素)疗法、化疗以及在某些情况下的靶向生物疗法(抗体)。\n", + "\n", + "在过去,所有乳腺癌都是通过乳房切除术(完全切除乳房)进行手术治疗。当恶性肿瘤很大时,可能仍然需要采用乳房切除术。目前,大多数乳腺癌可以采用一种叫做“乳房肿瘤切除术”或乳房部分切除术的较小手术来治疗,在这种手术中,只从乳房中切除肿瘤。在此情况下,通常需要对乳房进行放射治疗,以尽量减少乳房中恶性肿瘤复发的机会。\n", + "\n", + "在对侵袭性恶性肿瘤实行癌症手术时,淋巴结会被切除。在过去,完全切除腋下淋巴结(完全切除腋窝淋巴结)被认为是防止恶性肿瘤扩散的必要措施。现在,一种叫做“前哨淋巴结活检”的较小淋巴结手术更受欢迎,因为它的并发症较少。它使用染色示踪剂和/或放射性示踪剂来寻找恶性肿瘤可能从乳房扩散的最初几个淋巴结。\n", + "\n", + "乳腺癌的药物治疗可以在手术前(“新辅助治疗”)或手术后(“辅助治疗”)进行,这取决于癌症的生物学分亚型。表达雌激素受体(ER)和/或孕酮受体(PR)的恶性肿瘤可能对他莫昔芬或芳香酶抑制剂等内分泌(激素)疗法产生反应。口服这些药物五至十年会将这些“激素阳性”恶性肿瘤的复发几率降低近一半。内分泌疗法可能导致出现更年期症状,但通常耐受性良好。\n", + "\n", + "不表达雌激素受体或孕酮受体的恶性肿瘤属于“激素受体阴性”,除非恶性肿瘤很小,否则需要进行化疗。目前可用的化疗方案在减少癌细胞扩散或复发的机会方面非常有效,通常作为门诊治疗手段。在没有并发症的情况下,乳腺癌的化疗通常不需要住院。\n", + "\n", + "乳腺癌可能会独自过度表达一种叫做HER-2/neu癌基因的分子。这些“HER-2阳性”恶性肿瘤可以用曲妥珠单抗等靶向生物制剂进行治疗。这些生物制剂非常有效,但也非常昂贵,因为它们是抗体,而不是化学品。在实施靶向生物治疗时,与化疗结合会使它们能够有效地杀死癌细胞。\n", + "\n", + "在乳腺癌的治疗中,放射治疗也起着非常重要的作用。对于早期乳腺癌而言,放射治疗可以防止妇女不得不实行乳房切除术。对于后期癌症而言,即使已经实行了乳房切除术,放射治疗也可降低癌症复发的风险。对于晚期乳腺癌而言,在某些情况下,放射治疗可以降低死于这种疾病的可能性。\n", + "\n", + "乳腺癌治疗的有效性取决于整个治疗过程。局部治疗不太可能取得积极的治疗结果。 \n", + "\n", + "在高收入国家,乳腺癌确诊后至少5年的存活率超过90%,印度为66%,南非为40%。在高收入国家,早发现和早治疗已被证明是成功的,应在资源有限但有一些标准工具可用的国家采用这一方法。用于治疗乳腺癌的绝大多数药物已被列入世卫组织基本药物清单。因此,全球在治疗乳腺癌方面的重大改进可以通过实施我们已经知道有效的措施来实现。\n", + "\n", + "从20世纪80年代到2020年,高收入国家的年龄标准化乳腺癌死亡率下降了40%。已经成功降低乳腺癌死亡率的国家已经能够实现乳腺癌死亡率每年下降2%至4%的目标。如果全球死亡率每年下降2.5%,则将会在2020至2040年期间减少乳腺癌死亡250万人。\n", + "\n", + "改善乳腺癌预后的策略取决于为提供已知有效的治疗方法而加强基础卫生系统的情况。这些工作对于治疗其他癌症和其他非恶性非传染性疾病也很重要。例如,拥有从初级保健机构向地区医院和专门的肿瘤治疗中心的可靠转诊途径。\n", + "\n", + "建立从初级保健机构向地区医院和专门的肿瘤治疗中心的可靠转诊途径需要的管理方法与宫颈癌、肺癌、结肠直肠癌和前列腺癌相同。为此,乳腺癌是一种“标志性”疾病,为其建立的转诊途径也可用于管理其他疾病。\n", + "\n", + "世卫组织全球乳腺癌行动(GBCI)的目标是让全球乳腺癌死亡率每年下降2.5%,从而在2020至2040年期间在全球范围内减少乳腺癌死亡250万人。全球乳腺癌死亡率每年下降2.5%,到2030年乳腺癌死亡减少25%,到2040年70岁以下女性乳腺癌死亡率减少40%。实现这些目标的三大支柱是:早发现,促进健康;及时诊断;和全面的乳腺癌管理。\n", + "\n", + "通过开展公共卫生教育活动,提高妇女对乳腺癌体征和症状的认识,并与她们的家人们一起了解早发现和早治疗的重要性,让更多的妇女在首次怀疑患有乳腺癌时以及在任何现有癌症进入晚期之前就能就诊。即使没有乳房X光筛查,也可以做到这一点,目前,很多国家尚无法开展这种筛查。\n", + "\n", + "需要将公共教育与卫生工作者教育结合起来,让他们了解早期乳腺癌的体征和症状,以便在适当时能够将妇女转诊到诊断机构。需要将快速诊断与有效的癌症治疗联系起来,在很多情况下,癌症治疗需要一定程度的专业癌症护理。通过在癌症治疗机构或医院建立集中化服务,以乳腺癌作为一种模式,可以在改善其他癌症管理的同时优化乳腺癌治疗。\n", + "\n", + "
      \n", + "\n", + "(1) 年龄标准化是一种用于在人口年龄分布存在很大差异时进行人口比较的技术。\n", + "\n", + " \n", + "\n", + "新的全球乳腺癌行动突出了对提高生存率的再次承诺 - 英文\n", + "\n", + " \n", + "\n" + ] + } + ], + "source": [ + "import re\n", + "\n", + "patten = re.compile('

      (.*?)

      ')\n", + "with open('page.txt' , 'r' , encoding=\"utf-8\") as f:\n", + " s = ''\n", + " for i in f:\n", + " s += str(i)\n", + " res = re.findall(patten , s)\n", + " with open('breast_cancer.txt' , 'w' , encoding=\"utf-8\") as f1:\n", + " for j in res:\n", + " f1.write(j + '\\n')\n", + " f1.close()\n", + " f.close()\n", + "\n", + "with open('breast_cancer.txt' , 'r' , encoding='utf-8') as f:\n", + " for i in f.readlines():\n", + " print(i)\n", + " f.close()\n" + ], + "metadata": { + "collapsed": false + } + }, + { + "cell_type": "code", + "execution_count": 1, + "outputs": [], + "source": [], + "metadata": { + "collapsed": false + } + }, + { + "cell_type": "code", + "execution_count": 7, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[]\n" + ] + } + ], + "source": [ + "import re\n", + "ex = '
      (.*)
      '\n", + "patten = re.compile(ex)\n", + "with open('page.txt' , 'r' , encoding='utf-8') as f:\n", + " s = ''\n", + " for i in f:\n", + " s += str(i)\n", + " res = re.findall(patten , s)\n", + " print(res)" + ], + "metadata": { + "collapsed": false + } + }, + { + "cell_type": "code", + "execution_count": 15, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "
      \n", + "

      重要事实

      • 2020年,乳腺癌在全球造成68.5万人死亡。
      • 约有一半的乳腺癌发生在除了性别和年龄之外没有特定风险因素的妇女当中。
      • 全世界各个国家都有乳腺癌。
      • 约有0.5%至1%的乳腺癌发生在男性身上。

      概述

      乳腺癌是一种异常乳腺细胞生长失控并形成肿瘤的疾病。如果不加以控制,肿瘤会扩散到全身并致命。

      乳腺癌细胞始于乳房中的乳管和/或产乳小叶内。最早的形式(原位)不会危及生命。癌细胞会扩散到附近的乳腺组织(侵袭)。这会形成肿瘤,导致出现肿块或增厚。

      侵袭性癌症可以扩散到附近的淋巴结或其他器官(转移)。转移可能致命。

      治疗以患者本人的情况、癌症类型及其扩散程度为依据。治疗方法结合了手术、放射疗法和药物治疗。

      问题的范围

      2020年,全球有230万名妇女被诊断患有乳腺癌,有68.5万人死亡。截至2020年底,在过去五年里,共有780万名在世妇女被诊断患有乳腺癌,使其成为世界上最常见的癌症。世界上每个国家的妇女在青春期之后的任何年龄都会发生乳腺癌,但在晚年的发病率会越来越高。

      从20世纪30年代到70年代,乳腺癌死亡率变化不大,当时主要的治疗方式(根治性乳房切除术)只有手术。存活率的提高始于20世纪90年代,那时各国建立了乳腺癌早发现规划,这些规划与包括有效药物治疗在内的综合治疗规划相关联。

      谁有风险?

      女性的性别是最强的乳腺癌风险因素。约有0.5%至1%的乳腺癌发生在男性身上。男性乳腺癌治疗应遵循与女性相同的管理原则。

      某些因素会增加患乳腺癌的风险,包括年龄增长、肥胖、有害使用酒精、乳腺癌家族史、辐射暴露史、生殖史(如月经开始的年龄和首次怀孕的年龄)、使用烟草和绝经后激素治疗。约有一半的乳腺癌发生在除了性别(女性)和年龄(40岁以上)以外没有其他可识别乳腺癌风险因素的妇女当中。

      乳腺癌家族史增加了乳腺癌的风险,但大多数被诊断为患有乳腺癌的妇女没有已知的乳腺癌家族史。没有已知的家族史未必意味着女性患有乳腺癌的风险降低。

      某些遗传的“高外显率”基因突变大大增加了乳腺癌风险,最主要的是BRCA1、BRCA2和PALB-2基因的突变。被发现这些主要基因中存在突变的女性可以考虑采用手术切除双乳房等降低风险的策略。

      症状和体征

      乳腺癌可以有多种症状,尤其是在较晚期。大多数人在癌症早期没有任何症状。

      乳腺癌的症状可包括:

      • 乳房出现肿块或增厚,通常无疼痛
      • 乳房大小、形状或外观出现变化
      • 皮肤出现凹陷、发红、蚀损斑或其他变化
      • 乳头外观出现变化或乳头周围皮肤(乳晕)出现变化
      • 乳头出现异常或血性溢液。

      乳房出现异常肿块的人应就医,即使肿块无疼痛。

      大部分乳房肿块不是癌症。癌性乳房肿块在体积小并且未扩散到附近的淋巴结时更有可能得到成功治疗。

      乳腺癌可能会扩散到身体的其他部位,并引发其他症状。通常情况下,尽管可能有无法感觉到的淋巴结恶性肿瘤,但最先可以检测到的最常见的扩散部位是手臂下的淋巴结。

      随着时间的推移,恶性肿瘤可能会扩散到包括肺、肝、脑和骨骼在内的其他器官。一旦它们到达这些部位,就可能会出现骨痛或头痛等新的与癌症相关的症状。

      治疗

      乳腺癌的治疗取决于癌症亚型以及从乳房向外扩散到淋巴结(II期或III期)或身体其他部位(IV期)的程度。

      医生会结合不同的治疗方法以最大限度地降低癌症复发的可能性。这些治疗包括:

      • 手术切除乳腺肿瘤
      • 放射治疗以降低在乳房和周围组织中复发的风险
      • 用药物杀死癌细胞并防止扩散,包括激素疗法、化疗或靶向生物疗法

      乳腺癌的治疗如果在早期开始并完成全部疗程,效果和耐受性都会更好。

      手术可以只切除癌组织(叫做乳房肿瘤切除术)或整个乳房(乳房切除术)。手术也可以切除淋巴结以评估癌症的扩散能力。

      放射疗法治疗的是残留在乳腺组织和/或淋巴结中的微小癌症,可以最大限度地降低癌症在胸壁上复发的可能性。

      癌症晚期可能会损害皮肤,导致开放性伤口(溃疡),但不一定疼痛。有乳房伤口不愈情形的妇女应就医并进行活检。

      治疗乳腺癌的药物选择依据是由特殊测试(肿瘤标志物测定)确定的癌症生物学特性。用于治疗乳腺癌的绝大多数药物已被列入世卫组织基本药物清单。

      在对侵袭性恶性肿瘤实行癌症手术时,淋巴结会被切除。在过去,完全切除腋下淋巴结(完全切除腋窝淋巴结)被认为是防止恶性肿瘤扩散的必要措施。现在,一种叫做“前哨淋巴结活检”的较小淋巴结手术更受欢迎,因为它的并发症较少。

      乳腺癌的药物治疗可以在手术前(“新辅助治疗”)或手术后(“辅助治疗”)进行,这取决于癌症的生物学分亚型。表达雌激素受体(ER)和/或孕酮受体(PR)的恶性肿瘤可能对他莫昔芬或芳香酶抑制剂等内分泌(激素)疗法产生反应。口服这些药物五至十年会将这些“激素阳性”恶性肿瘤的复发几率降低近一半。内分泌疗法可能导致出现更年期症状,但通常耐受性良好。

      不表达雌激素受体或孕酮受体的恶性肿瘤属于“激素受体阴性”,除非恶性肿瘤很小,否则需要进行化疗。目前可用的化疗方案在减少癌细胞扩散或复发的机会方面非常有效,通常作为门诊治疗手段。在没有并发症的情况下,乳腺癌的化疗通常不需要住院。

      乳腺癌可能会独自过度表达一种叫做HER-2/neu癌基因的分子。这些“HER-2阳性”恶性肿瘤可以用曲妥珠单抗等靶向生物制剂进行治疗。这些生物制剂非常有效,但也非常昂贵,因为它们是抗体,而不是化学品。在实施靶向生物治疗时,与化疗结合会使它们能够有效地杀死癌细胞。

      在乳腺癌的治疗中,放射治疗起着非常重要的作用。对于早期乳腺癌而言,放射治疗可以防止妇女不得不实行乳房切除术。对于后期癌症而言,即使已经实行了乳房切除术,放射治疗也可降低癌症复发的风险。对于晚期乳腺癌而言,在某些情况下,放射治疗可以降低死于这种疾病的可能性。

      乳腺癌治疗的有效性取决于整个治疗过程。局部治疗不太可能取得积极的治疗结果。

      全球影响

      从20世纪80年代到2020年,高收入国家的年龄标准化乳腺癌死亡率下降了40%。已经成功降低乳腺癌死亡率的国家已经能够实现乳腺癌死亡率每年下降2%至4%的目标。

      改善乳腺癌预后的策略取决于为提供已知有效的治疗方法而加强基础卫生系统的情况。这些工作对于治疗其他癌症和其他非恶性非传染性疾病也很重要。例如,拥有从初级保健机构向地区医院和专门的肿瘤治疗中心的可靠转诊途径。

      建立从初级保健机构向地区医院和专门的肿瘤治疗中心的可靠转诊途径需要的管理方法与宫颈癌、肺癌、结肠直肠癌和前列腺癌相同。为此,乳腺癌是一种“标志性”疾病,为其建立的转诊途径也可用于管理其他疾病。

      世卫组织的应对

      世卫组织全球乳腺癌行动(GBCI)的目标是让全球乳腺癌死亡率每年下降2.5%,从而在2020至2040年期间在全球范围内减少乳腺癌死亡250万人。全球乳腺癌死亡率每年下降2.5%,到2030年乳腺癌死亡减少25%,到2040年70岁以下女性乳腺癌死亡率减少40%。实现这些目标的三大支柱是:早发现,促进健康;及时诊断;和全面的乳腺癌管理。

      通过开展公共卫生教育活动,提高妇女对乳腺癌体征和症状的认识,并与她们的家人们一起了解早发现和早治疗的重要性,让更多的妇女在首次怀疑患有乳腺癌时以及在任何现有癌症进入晚期之前就能就诊。即使没有乳房X光筛查,也可以做到这一点,目前,很多国家尚无法开展这种筛查。

      需要将公共教育与卫生工作者教育结合起来,让他们了解早期乳腺癌的体征和症状,以便在适当时能够将妇女转诊到诊断机构。

      需要将快速诊断与有效的癌症治疗联系起来,在很多情况下,癌症治疗需要一定程度的专业癌症护理。通过在癌症治疗机构或医院建立集中化服务,以乳腺癌作为一种模式,可以在改善其他癌症管理的同时优化乳腺癌治疗。

      _________________________________

      1 年龄标准化是一种用于在人口年龄分布存在很大差异时进行人口比较的技术。

       

      \n", + "
      \n", + "\n" + ] + } + ], + "source": [ + "from html.parser import HTMLParser\n", + "import requests\n", + "from lxml import etree\n", + "\n", + "path = \"//*[@id=\\\"PageContent_T0643CD2A003_Col00\\\"]/article\"\n", + "url = \"https://www.who.int/zh/news-room/fact-sheets/detail/breast-cancer\"\n", + "ua = \"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Safari/537.36 Edg/117.0.2045.47\"\n", + "with requests.request('GET',url,headers = {'User-agent':ua}) as res:\n", + " content = res.text #获取HTML的内容\n", + " html = etree.HTML(content) #分析HTML,返回DOM根节点\n", + " res = html.xpath(path)\n", + " tree = etree.tostring(res[0],encoding='utf-8').decode('utf-8')\n", + " print(tree)\n", + " with open('breast_cancer.txt' , 'w' , encoding=\"utf-8\") as f1:\n", + " for j in tree:\n", + " f1.write(j)\n", + " f1.close()\n", + " f.close()" + ], + "metadata": { + "collapsed": false + } + }, + { + "cell_type": "code", + "execution_count": null, + "outputs": [], + "source": [], + "metadata": { + "collapsed": false + } + } + ], + "metadata": { + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 2 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython2", + "version": "2.7.6" + } + }, + "nbformat": 4, + "nbformat_minor": 0 +} diff --git a/src/medicine/癌症数据获取/Get_Cancer_Information/sql/breast-cancer.txt b/src/medicine/癌症数据获取/Get_Cancer_Information/sql/breast-cancer.txt new file mode 100644 index 00000000..151c1b80 --- /dev/null +++ b/src/medicine/癌症数据获取/Get_Cancer_Information/sql/breast-cancer.txt @@ -0,0 +1,3 @@ +
      +

      重要事实

      • 2020年,乳腺癌在全球造成68.5万人死亡。
      • 约有一半的乳腺癌发生在除了性别和年龄之外没有特定风险因素的妇女当中。
      • 全世界各个国家都有乳腺癌。
      • 约有0.5%至1%的乳腺癌发生在男性身上。

      概述

      乳腺癌是一种异常乳腺细胞生长失控并形成肿瘤的疾病。如果不加以控制,肿瘤会扩散到全身并致命。

      乳腺癌细胞始于乳房中的乳管和/或产乳小叶内。最早的形式(原位)不会危及生命。癌细胞会扩散到附近的乳腺组织(侵袭)。这会形成肿瘤,导致出现肿块或增厚。

      侵袭性癌症可以扩散到附近的淋巴结或其他器官(转移)。转移可能致命。

      治疗以患者本人的情况、癌症类型及其扩散程度为依据。治疗方法结合了手术、放射疗法和药物治疗。

      问题的范围

      2020年,全球有230万名妇女被诊断患有乳腺癌,有68.5万人死亡。截至2020年底,在过去五年里,共有780万名在世妇女被诊断患有乳腺癌,使其成为世界上最常见的癌症。世界上每个国家的妇女在青春期之后的任何年龄都会发生乳腺癌,但在晚年的发病率会越来越高。

      从20世纪30年代到70年代,乳腺癌死亡率变化不大,当时主要的治疗方式(根治性乳房切除术)只有手术。存活率的提高始于20世纪90年代,那时各国建立了乳腺癌早发现规划,这些规划与包括有效药物治疗在内的综合治疗规划相关联。

      谁有风险?

      女性的性别是最强的乳腺癌风险因素。约有0.5%至1%的乳腺癌发生在男性身上。男性乳腺癌治疗应遵循与女性相同的管理原则。

      某些因素会增加患乳腺癌的风险,包括年龄增长、肥胖、有害使用酒精、乳腺癌家族史、辐射暴露史、生殖史(如月经开始的年龄和首次怀孕的年龄)、使用烟草和绝经后激素治疗。约有一半的乳腺癌发生在除了性别(女性)和年龄(40岁以上)以外没有其他可识别乳腺癌风险因素的妇女当中。

      乳腺癌家族史增加了乳腺癌的风险,但大多数被诊断为患有乳腺癌的妇女没有已知的乳腺癌家族史。没有已知的家族史未必意味着女性患有乳腺癌的风险降低。

      某些遗传的“高外显率”基因突变大大增加了乳腺癌风险,最主要的是BRCA1、BRCA2和PALB-2基因的突变。被发现这些主要基因中存在突变的女性可以考虑采用手术切除双乳房等降低风险的策略。

      症状和体征

      乳腺癌可以有多种症状,尤其是在较晚期。大多数人在癌症早期没有任何症状。

      乳腺癌的症状可包括:

      • 乳房出现肿块或增厚,通常无疼痛
      • 乳房大小、形状或外观出现变化
      • 皮肤出现凹陷、发红、蚀损斑或其他变化
      • 乳头外观出现变化或乳头周围皮肤(乳晕)出现变化
      • 乳头出现异常或血性溢液。

      乳房出现异常肿块的人应就医,即使肿块无疼痛。

      大部分乳房肿块不是癌症。癌性乳房肿块在体积小并且未扩散到附近的淋巴结时更有可能得到成功治疗。

      乳腺癌可能会扩散到身体的其他部位,并引发其他症状。通常情况下,尽管可能有无法感觉到的淋巴结恶性肿瘤,但最先可以检测到的最常见的扩散部位是手臂下的淋巴结。

      随着时间的推移,恶性肿瘤可能会扩散到包括肺、肝、脑和骨骼在内的其他器官。一旦它们到达这些部位,就可能会出现骨痛或头痛等新的与癌症相关的症状。

      治疗

      乳腺癌的治疗取决于癌症亚型以及从乳房向外扩散到淋巴结(II期或III期)或身体其他部位(IV期)的程度。

      医生会结合不同的治疗方法以最大限度地降低癌症复发的可能性。这些治疗包括:

      • 手术切除乳腺肿瘤
      • 放射治疗以降低在乳房和周围组织中复发的风险
      • 用药物杀死癌细胞并防止扩散,包括激素疗法、化疗或靶向生物疗法

      乳腺癌的治疗如果在早期开始并完成全部疗程,效果和耐受性都会更好。

      手术可以只切除癌组织(叫做乳房肿瘤切除术)或整个乳房(乳房切除术)。手术也可以切除淋巴结以评估癌症的扩散能力。

      放射疗法治疗的是残留在乳腺组织和/或淋巴结中的微小癌症,可以最大限度地降低癌症在胸壁上复发的可能性。

      癌症晚期可能会损害皮肤,导致开放性伤口(溃疡),但不一定疼痛。有乳房伤口不愈情形的妇女应就医并进行活检。

      治疗乳腺癌的药物选择依据是由特殊测试(肿瘤标志物测定)确定的癌症生物学特性。用于治疗乳腺癌的绝大多数药物已被列入世卫组织基本药物清单。

      在对侵袭性恶性肿瘤实行癌症手术时,淋巴结会被切除。在过去,完全切除腋下淋巴结(完全切除腋窝淋巴结)被认为是防止恶性肿瘤扩散的必要措施。现在,一种叫做“前哨淋巴结活检”的较小淋巴结手术更受欢迎,因为它的并发症较少。

      乳腺癌的药物治疗可以在手术前(“新辅助治疗”)或手术后(“辅助治疗”)进行,这取决于癌症的生物学分亚型。表达雌激素受体(ER)和/或孕酮受体(PR)的恶性肿瘤可能对他莫昔芬或芳香酶抑制剂等内分泌(激素)疗法产生反应。口服这些药物五至十年会将这些“激素阳性”恶性肿瘤的复发几率降低近一半。内分泌疗法可能导致出现更年期症状,但通常耐受性良好。

      不表达雌激素受体或孕酮受体的恶性肿瘤属于“激素受体阴性”,除非恶性肿瘤很小,否则需要进行化疗。目前可用的化疗方案在减少癌细胞扩散或复发的机会方面非常有效,通常作为门诊治疗手段。在没有并发症的情况下,乳腺癌的化疗通常不需要住院。

      乳腺癌可能会独自过度表达一种叫做HER-2/neu癌基因的分子。这些“HER-2阳性”恶性肿瘤可以用曲妥珠单抗等靶向生物制剂进行治疗。这些生物制剂非常有效,但也非常昂贵,因为它们是抗体,而不是化学品。在实施靶向生物治疗时,与化疗结合会使它们能够有效地杀死癌细胞。

      在乳腺癌的治疗中,放射治疗起着非常重要的作用。对于早期乳腺癌而言,放射治疗可以防止妇女不得不实行乳房切除术。对于后期癌症而言,即使已经实行了乳房切除术,放射治疗也可降低癌症复发的风险。对于晚期乳腺癌而言,在某些情况下,放射治疗可以降低死于这种疾病的可能性。

      乳腺癌治疗的有效性取决于整个治疗过程。局部治疗不太可能取得积极的治疗结果。

      全球影响

      从20世纪80年代到2020年,高收入国家的年龄标准化乳腺癌死亡率下降了40%。已经成功降低乳腺癌死亡率的国家已经能够实现乳腺癌死亡率每年下降2%至4%的目标。

      改善乳腺癌预后的策略取决于为提供已知有效的治疗方法而加强基础卫生系统的情况。这些工作对于治疗其他癌症和其他非恶性非传染性疾病也很重要。例如,拥有从初级保健机构向地区医院和专门的肿瘤治疗中心的可靠转诊途径。

      建立从初级保健机构向地区医院和专门的肿瘤治疗中心的可靠转诊途径需要的管理方法与宫颈癌、肺癌、结肠直肠癌和前列腺癌相同。为此,乳腺癌是一种“标志性”疾病,为其建立的转诊途径也可用于管理其他疾病。

      世卫组织的应对

      世卫组织全球乳腺癌行动(GBCI)的目标是让全球乳腺癌死亡率每年下降2.5%,从而在2020至2040年期间在全球范围内减少乳腺癌死亡250万人。全球乳腺癌死亡率每年下降2.5%,到2030年乳腺癌死亡减少25%,到2040年70岁以下女性乳腺癌死亡率减少40%。实现这些目标的三大支柱是:早发现,促进健康;及时诊断;和全面的乳腺癌管理。

      通过开展公共卫生教育活动,提高妇女对乳腺癌体征和症状的认识,并与她们的家人们一起了解早发现和早治疗的重要性,让更多的妇女在首次怀疑患有乳腺癌时以及在任何现有癌症进入晚期之前就能就诊。即使没有乳房X光筛查,也可以做到这一点,目前,很多国家尚无法开展这种筛查。

      需要将公共教育与卫生工作者教育结合起来,让他们了解早期乳腺癌的体征和症状,以便在适当时能够将妇女转诊到诊断机构。

      需要将快速诊断与有效的癌症治疗联系起来,在很多情况下,癌症治疗需要一定程度的专业癌症护理。通过在癌症治疗机构或医院建立集中化服务,以乳腺癌作为一种模式,可以在改善其他癌症管理的同时优化乳腺癌治疗。

      _________________________________

      1 年龄标准化是一种用于在人口年龄分布存在很大差异时进行人口比较的技术。

       

      +
      diff --git a/src/medicine/癌症数据获取/Get_Cancer_Information/sql/colorectal-cancer.txt b/src/medicine/癌症数据获取/Get_Cancer_Information/sql/colorectal-cancer.txt new file mode 100644 index 00000000..336cc0ac --- /dev/null +++ b/src/medicine/癌症数据获取/Get_Cancer_Information/sql/colorectal-cancer.txt @@ -0,0 +1,3 @@ +
      +

      重要事实

      • 结直肠癌是全世界第三常见的癌症,约占所有癌症病例的10%,它也是全世界癌症相关死亡的第二大原因。
      • 结直肠癌主要影响老年人,大多数病例在50岁及以上。
      • 一些生活方式因素会促发结直肠癌,例如加工肉制品摄入量高而水果和蔬菜摄入量低、久坐不动的生活方式、肥胖症、吸烟和过量饮酒。
      • 结直肠癌常常在治疗选择有限的晚期才被诊断出来。
      • 通过实施初级预防战略,例如采用健康的生活方式、避免风险因素和通过筛查早期发现,可以显著降低结直肠癌的发病率和影响。

      概述

      结直肠癌是一种影响结肠(大肠)或直肠的癌症。它是全世界最常见的癌症类型之一,可以导致严重伤害和死亡。

      结直肠癌的风险随着年龄的增长而增加。大多数病例在50岁以上。

      常见症状包括腹泻、便秘、便血、腹痛、不明原因体重减轻、疲劳和铁含量低。

      许多人在该病的早期阶段没有症状。

      通过健康饮食、保持身体活动、不吸烟和限制饮酒,可以降低患结直肠癌的风险。定期筛查对于早期发现至关重要。

      结肠癌是全球癌症相关死亡的第二大原因。2020年,估计全球范围内有超过190万例结直肠癌新发病例和超过93万例结直肠癌死亡病例。据观察,发病率和死亡率存在很大的地域差异。欧洲、澳大利亚和新西兰的发病率最高,东欧的死亡率最高。到2040年,结直肠癌负担将增加到每年320万例新发病例(增加63%)和160万例死亡病例(增加73%)。

      在高收入国家,结直肠癌发病率一直在下降,主要原因在于有效的筛查规划。结直肠癌的预后因诊断分期而异。癌症早期的成活率高于癌症晚期。及时诊断、适当治疗和定期随访照护对于提高成活率和生活质量非常重要。

      风险因素

      可能增加患结直肠癌风险的因素包括:

      • 年龄:患结直肠癌的风险随着年龄的增长而增加,大多数病例在50岁以上;
      • 家族史:结直肠癌或某些遗传病(如林奇综合征和家族性腺瘤性息肉病)家族史会增加风险;
      • 个人病史:以往患有结直肠癌或某些类型息肉的人风险较高;
      • 生活方式因素:不健康的生活方式选择(例如加工肉制品摄入量高而水果和蔬菜摄入量低的饮食、久坐不动的行为、肥胖症、吸烟和过量饮酒)都会增加风险。

      症状

      结直肠癌在早期阶段通常没有症状。定期筛查对于及早发现该病并开始治疗很重要。

      常见症状包括:

      • 排便习惯改变,如腹泻、便秘或大便变细
      • 便血(直肠出血),呈鲜红色或深色焦油状
      • 持续性腹部绞痛、疼痛或腹胀
      • 在未尝试减肥的情况下体重不明原因骤降
      • 即使休息充分,也经常感到疲倦和精力不足
      • 因慢性出血而引起缺铁性贫血,导致疲劳、虚弱无力和苍白。

      预防

      改变生活方式和定期筛查可以帮助预防结直肠癌。

      有助于预防结直肠癌的生活方式包括:

      • 健康饮食,多吃水果和蔬菜
      • 不吸烟
      • 保持积极的生活方式
      • 限制饮酒
      • 避免接触环境风险因素。

      怀疑自己可能患有结直肠癌的人应立即向其卫生保健服务提供者进行咨询。

      定期筛查结直肠癌(二级预防)是及早发现该病的最佳方法。

      在早期阶段接受治疗更有可能治愈该病。

      研究表明,筛查可以通过早期发现和消除癌前生长来降低结直肠癌的发病率和死亡率。

      粪便检查是无创筛查方法,可用于发现是否存在结直肠癌或癌前息肉。常见的粪便检查类型是粪便潜血测试。粪便潜血测试可检测到粪便隐血,而这可能表明存在结直肠癌或息肉。该测试包括收集少量粪便样本并将其送到实验室进行分析。如果在粪便中检测到血液或有异常发现,通常建议使用结肠镜检查等进一步诊断程序,以确认是否存在结直肠癌或息肉。

      粪便检查方便快捷、没有创伤,并且可以有效检测到早期结直肠癌或识别癌前息肉。

      有结直肠癌或某些遗传病家族史的人可借助遗传咨询和基因检测,评估其风险并确定适当的筛查措施。

      诊断

      结直肠癌的诊断方法包括身体检查、影像学检查(如腹部超声、计算机断层扫描和磁共振成像)、使用结肠镜或乙状结肠镜检查结肠内部、采集组织样本(活检)进行组织病理学检查,以及进行分子检测以确定特定的基因突变或生物标志物,用以指导最佳治疗方案。

      治疗和护理

      结直肠癌的治疗依据是癌症类型和发展程度以及患者的病史。早期发现结直肠癌可以带来更好的治疗和结果。

      治疗包括:

      • 手术
      • 放射治疗(放疗)
      • 化疗
      • 靶向治疗
      • 免疫疗法。

      如果肿瘤尚未扩散到身体的其他部位,则通常在癌症早期阶段进行手术。化疗和放疗可以帮助缩小肿瘤。

      来自多个学科的医生经常开展合作,为结直肠癌患者提供治疗和护理。

      支持性护理对结直肠癌患者很重要。它旨在管理症状,缓解疼痛并提供情感支持。它可以帮助提高结直肠癌患者及其家人的生活质量。

      护理阶段

      a) 早期疾病早期结直肠癌(即肿瘤仅限于肠道或局部淋巴结,没有转移到远处器官)的主要治疗方法是手术切除肿瘤和附近的淋巴结。具体的外科手术取决于肿瘤的位置。这可能涉及结肠切除术(切除部分结肠)或直肠切除术(切除直肠)。在某些情况下,可能需要进行临时或永久性结肠造口术或回肠造口术,制造开口以排泄粪便。辅助治疗是指手术后给予的补充治疗,以降低癌症复发的风险。对于早期结直肠癌,可建议使用辅助化疗来消灭任何在手术过程中无法看到或切除的残留癌细胞。对于复发风险较高的患者,例如淋巴结受累或表现出某些肿瘤特征的患者,通常建议使用辅助化疗。有时可在手术前进行化疗(新辅助化疗)以缩小肿瘤。放射治疗可针对肠道最后一段(直肠)的肿瘤,以增加肿瘤缩小的机会。

      治疗后,定期随访和监测对于发现任何复发或新发癌症的迹象至关重要。监测可包括身体检查、血液检测和影像学检查(如计算机断层扫描),以便在早期发现任何潜在复发。

      a) 晚期疾病全身性治疗是转移性结直肠癌的主要治疗方法,因为它针对的是全身的癌细胞。化疗通常被用作转移性结直肠癌的一线治疗方法。联合化疗方案通常用于杀死癌细胞或减缓其生长。对于有特定基因突变(例如KRAS或BRAF基因突变)的患者,靶向治疗可与化疗结合使用。对于肿瘤中有特定遗传标志物(例如微卫星高度不稳定性(MSI-H)或错配修复缺陷(dMMR))的患者,可考虑使用免疫治疗药物。

      在某些情况下,可建议对转移性结直肠癌患者进行手术,以切除引起症状或阻塞肠道的肿瘤。局部治疗(如射频消融、冷冻消融或放射治疗)可用于治疗特定部位转移,如肝转移。放射治疗可用于帮助控制疾病和管理症状,如疼痛或出血。

      临床试验

      临床试验为患者提供了获得新疗法或实验性疗法的机会。参与临床试验有助于增加医学知识,并可能会提供新的治疗选择。

      世卫组织的应对

      世卫组织积极参与解决全球结直肠癌负担,并实施各项战略以减少其影响。世卫组织的方法包括提高认识、癌症预防和控制、早期发现和筛查、加强卫生系统、能力建设、研究和监测以及协作和伙伴关系。这些全面工作通过促进预防、早期发现、公平获得优质护理和改善全球总体癌症控制,可帮助减轻结直肠癌负担。

      +
      diff --git a/src/medicine/癌症数据获取/Get_Cancer_Information/sql/lung-cancer.txt b/src/medicine/癌症数据获取/Get_Cancer_Information/sql/lung-cancer.txt new file mode 100644 index 00000000..53f48b20 --- /dev/null +++ b/src/medicine/癌症数据获取/Get_Cancer_Information/sql/lung-cancer.txt @@ -0,0 +1,3 @@ +
      +

      重要事实:

      • 肺癌是全世界癌症相关死亡的主要原因,男性和女性的死亡率均为最高。
      • 吸烟是肺癌的主要原因,约占所有病例的85%。
      • 肺癌常常在治疗选择有限的晚期才被诊断出来。
      • 筛查高危个体有可能及早发现病例并显著提高存活率。
      • 一级预防(如烟草控制措施和减少接触环境风险因素)可以降低肺癌的发病率并挽救生命。

      概述

      肺癌是当异常细胞在肺部以不受控制的方式生长时开始的一种癌症。它是一个严重的健康问题,可以导致严重的伤害和死亡。

      肺癌的症状包括不消停的咳嗽、胸痛和呼吸急促。

      尽早就医以避免严重的健康影响非常重要。治疗取决于患者的病史和疾病的阶段。

      最常见的肺癌类型是非小细胞癌(NSCLC)和小细胞癌(SCLC)。非小细胞癌更常见且生长缓慢,而小细胞癌不太常见,但常常生长迅速。

      肺癌是一个重大的公共卫生问题,在全球造成大量死亡。国际癌症研究机构(IARC)对癌症发病率和死亡率的GLOBOCAN(全球癌症观察站)2020年估计显示,肺癌仍然是癌症死亡的主要原因,2020年估计造成180万人死亡(18%)。

      吸烟(包括香烟、雪茄和烟斗)是肺癌的主要高危因素,但也可以影响非吸烟者。其他高危因素包括接触二手烟、职业危害(如石棉、氡和某些化学品)、空气污染、遗传性癌症综合征和以前的慢性肺部疾病。

      症状

      肺癌可以引起若干症状,可能表明肺部有问题。

      最常见的症状包括:

      • 不消停的咳嗽
      • 胸痛
      • 呼吸短促
      • 咳血(咯血)
      • 疲劳
      • 不明原因的体重减轻
      • 肺部感染不断复发。

      早期症状可能较轻或被视为常见的呼吸系统问题,导致诊断延迟。

      预防

      不吸烟是预防肺癌的最佳方法。

      应避免的其它高危因素包括:

      • 二手烟雾
      • 空气污染
      • 工作场所的危害,如化学品和石棉。

      早期治疗可以防止肺癌恶化并扩散到身体的其他部位。

      肺癌的预防包括一级和二级预防措施。一级预防旨在通过降低风险和促进健康行为来预防疾病的最初发生。在公共卫生方面,这些预防措施包括戒烟,促进无烟环境,实施烟草控制政策,应对职业危害和降低空气污染水平。

      肺癌的二级预防包括筛查,以便在症状变得明显之前的早期阶段发现疾病,并且可以适用于高风险个体。在这一人群中,早期发现可以显著增加成功治疗的机会并改善结果。肺癌的主要筛查方法是低剂量计算机断层扫描(LDCT)。

      诊断

      肺癌的诊断方法包括身体检查、影像学检查(如胸部X线检查、计算机断层扫描和磁共振成像)、使用支气管镜检查肺的内部、采集组织样本(活检)进行组织病理学检查和确定具体亚型(NSCLC或SCLC),以及分子检测以确定特定的基因突变或生物标志物,用以指导最佳治疗方案。

      治疗和护理

      肺癌的治疗基于癌症的类型、扩散的程度以及患者的病史。早期发现肺癌可以带来更好的治疗和结果。

      治疗包括:

      • 手术
      • 放射治疗(放疗)
      • 化疗
      • 靶向治疗
      • 免疫疗法。

      如果肿瘤尚未扩散到身体的其他部位,则常常在肺癌的早期阶段使用手术。化疗和放疗可以帮助缩小肿瘤。

      来自多个学科的医生经常开展合作,为肺癌患者提供治疗和护理。

      支持性治疗对肺癌患者很重要。它旨在管理症状,缓解疼痛并提供情感支持。它有助于提高肺癌患者及其家人的生活质量。

      护理阶段

      a) 早期疾病:早期肺癌(即肿瘤仅限于肺部,没有转移到远处器官或淋巴结)的主要治疗方法是通过肺叶切除术、节段切除术或楔形切除术等手术切除肿瘤。新辅助治疗(手术前的化疗和/或放疗)有助于减小肿瘤大小,使其更易于手术切除。手术后常常建议进行辅助治疗(化疗和/或放疗),以降低癌症复发的风险。在手术不可行的情况下,可以使用放射治疗或立体定向放射治疗(SBRT)作为主要治疗方法。也可根据特定的肿瘤特征考虑靶向治疗和免疫治疗。应与医疗保健专业人员讨论个体化治疗计划。

      b) 晚期疾病:转移期肺癌的治疗,即癌症已扩散到远处器官或淋巴结,是基于各种因素的,包括患者的整体健康状况、转移的程度和位置、组织学,遗传特征和个人偏好。主要目标是延长生存期,缓解症状和提高生活质量。全身疗法,如化疗、靶向治疗和免疫治疗,在转移性肺癌的治疗中起着至关重要的作用。

      化疗常常是世界各地大多数患者的一线治疗方法,涉及使用在全身循环的药物来杀死癌细胞。通常使用联合化疗方案,药物的选择取决于癌症的组织学类型和患者的总体健康状况等因素。靶向治疗旨在阻断驱动癌细胞生长的信号通路,对于肿瘤中发现特定基因突变或生物标志物的患者来说,是一种重要的选择。免疫疗法,特别是免疫检查点抑制剂,彻底改变了转移性肺癌的治疗。这些药物有助于刺激免疫系统识别和攻击癌细胞。局部治疗,如放射治疗和手术,可用于管理特定的转移部位或缓解肿瘤生长引起的症状。

      临床试验

      临床试验为患者提供了获得新疗法或实验性疗法的机会。参与临床试验有助于推进医学知识,并可能会提供新的治疗选择。

      世卫组织的应对

      世卫组织认识到肺癌对全球健康的重大影响,并实施了若干举措以全面应对该疾病。世卫组织的应对措施侧重于烟草控制、癌症预防、早期发现以及改善获得优质治疗和护理的机会。世卫组织支持各国实施循证烟草控制政策,包括提高烟草税,全面禁止烟草广告、促销和赞助,以及对烟草制品实施强有力的图形健康警示。

      本组织还通过倡导健康的生活方式来促进癌症预防战略,包括定期的身体活动、健康的饮食和尽量减少接触环境风险因素。此外,世卫组织支持早期发现规划,并鼓励各国对高危人群实施筛查措施,以便在治疗方案更有效的早期发现肺癌。最后,通过向会员国提供技术指导,促进公平获得基本癌症药物,以及促进国际合作以分享最佳做法和改善癌症治疗结果,世卫组织努力确保肺癌患者能够获得优质治疗和护理。

      +
      diff --git a/src/medicine/癌症数据获取/Get_Cancer_Information/sql/savesql.py b/src/medicine/癌症数据获取/Get_Cancer_Information/sql/savesql.py new file mode 100644 index 00000000..d34b6dd8 --- /dev/null +++ b/src/medicine/癌症数据获取/Get_Cancer_Information/sql/savesql.py @@ -0,0 +1,66 @@ +from spider.Get_Information import Anaxpath as ap , Analyse as a +import pymysql +conn = pymysql.connect( + host="127.0.0.1", + port=3306, # 端口号 + user="root", # 数据库用户 + password="123456", # 数据库密码 + database="db1" # 要连接的数据库名称 +) +cursor = conn.cursor() + +# 肺癌、乳腺癌、结直肠癌 +l = ["lung-cancer" , "breast-cancer" , "colorectal-cancer"] +d = {"lung-cancer" : "肺癌" , "breast-cancer" : "乳腺癌" , "colorectal-cancer" : "结直肠癌"} +user = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Safari/537.36 Edg/117.0.2045.47" +for i in l: + url = "https://www.who.int/zh/news-room/fact-sheets/detail/" + i + savepath = i + ".txt" + ap(url , user , savepath) + res = a(savepath) + # print(res) + + # ['重要事实', '概述', '问题的范围', '谁有风险?', '症状和体征', '治疗', '全球影响'] + # ['重要事实', '概述', '风险因素', '症状', '预防', '诊断', '治疗和护理', '临床试验'] + # ['重要事实', '概述', '症状', '预防', '诊断', '治疗和护理', '护理阶段', '临床试验'] lung + # ['重要事实', '概述', '症状','风险因素','诊断', '治疗和护理'] + + for j in range(len(res)): + for h in range(len(res[j])): + res[j][h] = res[j][h].replace("a)" , '') + res[j][h] = res[j][h].replace("" , '') + res[j][h] = res[j][h].replace("", '') + res[j][h] = res[j][h].replace("", '') + res[j][h] = res[j][h].replace("%", '%%') + if i == "lung-cancer": + res[0][0] = res[0][0][:res[0][0].index(":")] + res[3][0] = "风险因素" + res.pop();res.pop() + elif i == "breast-cancer": + res.pop(2) + res[2][0] = "风险因素" + res[2] , res[3] = res[3] , res[2] + res[2][0] = "症状" + res.pop() + res[-1][0] = "治疗和护理" + res.insert(4 , ["诊断" , " "]) + else: + res[2] , res[3] = res[3] , res[2] + res.pop(4) + res.pop() + + save = [] + for j in res: + s = '' + for h in range(1 , len(j)): + s += j[h] + save.append([j[0] , s]) + + t = d[i] + for j in range(len(save)): + t += "," + save[j][1] + t = tuple(t.split(",")) + sql_insert = "insert into cancer_information (`癌症名称` , `重要事实` , `概述` , `症状` , `风险因素` , `诊断` , `治疗和护理`) values " + str(t) + print(sql_insert) + cursor.execute(sql_insert) + conn.commit() \ No newline at end of file