|
|
|
|
@ -0,0 +1,156 @@
|
|
|
|
|
# 邹佳轩第7周个人工作总结
|
|
|
|
|
|
|
|
|
|
## 基本信息
|
|
|
|
|
- **姓名**: 邹佳轩
|
|
|
|
|
- **总结周期**: 第7周(2025-11-03 至 2025-11-09)
|
|
|
|
|
- **项目**: 基于Hadoop的故障检测与自动恢复项目
|
|
|
|
|
- **总结时间**: 2025-11-10
|
|
|
|
|
|
|
|
|
|
## 本周工作完成情况
|
|
|
|
|
|
|
|
|
|
### 完成情况统计表
|
|
|
|
|
| 任务项目 | 计划目标 | 实际完成 | 完成状态 | 完成度 |
|
|
|
|
|
|----------|----------|----------|----------|--------|
|
|
|
|
|
| Hadoop集群部署 | 规划与设计、环境准备、安装配置、功能验证 | 完成集群规划、JDK与SSH免密、Hadoop安装与核心配置、格式化NN、启动HDFS/YARN与Web验证 | ✅ 已完成 | 93% |
|
|
|
|
|
| MySQL远程连接配置 | 安装MySQL、配置远程连接、用户授权、安全策略 | 完成安装与`bind-address`配置、创建远程用户与授权、开放3306、防护策略、远程连接测试通过 | ✅ 已完成 | 90% |
|
|
|
|
|
| Flume学习与实践 | 核心概念、配置案例、部署测试与总结 | 完成核心概念学习、编写多源汇聚与日志收集配置、部署测试与总结文档 | ✅ 已完成 | 88% |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
**个人整体完成度80%**
|
|
|
|
|
|
|
|
|
|
## 具体完成任务
|
|
|
|
|
|
|
|
|
|
### 1. Hadoop集群部署(周一-周三)
|
|
|
|
|
- **完成情况**: 明确节点规模与主机名命名规范,规划数据目录与端口;统一系统版本,创建专用用户与权限;安装JDK与环境变量;配置SSH免密;完成Hadoop安装与核心配置;格式化NameNode;启动HDFS/YARN并验证Web界面与基本功能。
|
|
|
|
|
- **技术成果**:
|
|
|
|
|
- 集群规划与设计文档(规模、IP/主机名、目录结构、端口规划)
|
|
|
|
|
- 核心配置文件包:`core-site.xml`、`hdfs-site.xml`、`yarn-site.xml`、`mapred-site.xml`
|
|
|
|
|
- 启停与环境脚本(环境变量、启动/停止脚本)
|
|
|
|
|
- 集群部署验证报告(状态截图、Web验证、基本操作结果)
|
|
|
|
|
|
|
|
|
|
### 2. MySQL远程连接配置(周四)
|
|
|
|
|
- **完成情况**: 安装MySQL 8.0,配置`bind-address`允许远程访问;创建远程用户并授权;开放3306端口与安全策略;完成客户端连接测试与权限验证;记录SSL与备份策略初步方案。
|
|
|
|
|
- **技术成果**:
|
|
|
|
|
- 安装配置文档与`my.cnf`关键参数说明
|
|
|
|
|
- 用户创建与授权脚本、远程连接测试报告(截图与参数)
|
|
|
|
|
- 安全策略与备份策略草案(强密码、权限最小化、SSL与备份流程)
|
|
|
|
|
|
|
|
|
|
### 3. Flume学习实践(周五-周六)
|
|
|
|
|
- **完成情况**: 系统学习Source/Channel/Sink与Agent数据流向;编写日志收集与多源汇聚配置;部署测试与性能参数初步调优;输出实践总结。
|
|
|
|
|
- **技术成果**:
|
|
|
|
|
- 核心概念学习文档(架构、组件、数据流、集成方案)
|
|
|
|
|
- 配置实例集合(日志文件监控、多源汇聚、参数说明)
|
|
|
|
|
- 部署实践总结(问题与解决、最佳实践、运维要点)
|
|
|
|
|
|
|
|
|
|
### 4. 交付物整理与总结(周日)
|
|
|
|
|
- **完成情况**: 将原40项交付物精简为15项核心交付物,分类为Hadoop、MySQL、Flume与综合成果,统一置于文末并形成闭环。
|
|
|
|
|
- **技术成果**: 形成交付物清单与验收标准对齐的结构化文档与脚本包。
|
|
|
|
|
|
|
|
|
|
## 遇到的问题及解决方案
|
|
|
|
|
|
|
|
|
|
### 问题1: HDFS/YARN端口冲突与Web访问异常
|
|
|
|
|
- **问题描述**: 初次启动时个别端口占用导致服务异常,Web UI无法访问。
|
|
|
|
|
- **根本原因**: 端口规划与服务依赖梳理不充分,防火墙规则未完全关闭或放行。
|
|
|
|
|
- **解决方案**: 统一端口规划;修订配置文件端口;关闭防火墙与SELinux或放行必要端口;按正确顺序启停服务。
|
|
|
|
|
- **解决状态**: ✅ 已解决
|
|
|
|
|
|
|
|
|
|
### 问题2: MySQL远程连接失败
|
|
|
|
|
- **问题描述**: 客户端无法远程连接,报错“Access denied”。
|
|
|
|
|
- **根本原因**: `bind-address`设定与用户主机匹配不正确,权限不足。
|
|
|
|
|
- **解决方案**: 调整`bind-address=0.0.0.0`;使用`'user'@'%'`创建并授权;`flush privileges`;验证端口与防火墙策略。
|
|
|
|
|
- **解决状态**: ✅ 已解决
|
|
|
|
|
|
|
|
|
|
### 问题3: Flume Channel积压与性能波动
|
|
|
|
|
- **问题描述**: 高峰期出现数据积压,吞吐波动较大。
|
|
|
|
|
- **根本原因**: Channel容量与批处理参数不匹配,Sink重试策略不合理。
|
|
|
|
|
- **解决方案**: 调整Channel容量与事务大小;优化批处理大小与重试机制;监控队列与延迟指标并迭代调参。
|
|
|
|
|
- **解决状态**: ⚠️ 持续优化中
|
|
|
|
|
|
|
|
|
|
## 未完成任务及原因分析
|
|
|
|
|
|
|
|
|
|
### 1. Hadoop高可用(HA)验证(完成度80%)
|
|
|
|
|
- **未完成部分**: HA切换与故障演练尚未执行完整用例。
|
|
|
|
|
- **原因分析**: 时间集中在基础部署与验证,HA演练安排在下周。
|
|
|
|
|
- **改进措施**: 制定HA演练脚本与步骤,下周补齐。
|
|
|
|
|
|
|
|
|
|
### 2. Flume性能深度调优(完成度85%)
|
|
|
|
|
- **未完成部分**: 在复杂场景下的参数组合与监控联动未完全验证。
|
|
|
|
|
- **原因分析**: 用例覆盖面需扩展,需引入更复杂的源与转换链路。
|
|
|
|
|
- **改进措施**: 下周补充压力测试与监控联动(告警与回退策略)。
|
|
|
|
|
|
|
|
|
|
## 学习收获与个人成长
|
|
|
|
|
|
|
|
|
|
### 技术能力提升
|
|
|
|
|
1. **集群规划与部署能力**: 从设计到落地的完整闭环,熟悉关键配置与验证。
|
|
|
|
|
2. **数据库远程与安全**: 掌握远程访问、权限与安全策略的通用方法。
|
|
|
|
|
3. **数据采集实践**: 理解Flume数据流与事务机制,能编写可用配置。
|
|
|
|
|
4. **运维脚本与验证**: 启停、健康检查、监控脚本化,提升效率与稳定性。
|
|
|
|
|
|
|
|
|
|
### 项目管理与习惯
|
|
|
|
|
1. **时间盒与复盘**: 分阶段推进与每日记录,周末集中整理成果。
|
|
|
|
|
2. **文档与交付意识**: 按验收标准组织文档与脚本,便于复用与评审。
|
|
|
|
|
3. **风险前置**: 提前规划端口、权限与资源,降低集成风险。
|
|
|
|
|
|
|
|
|
|
### 个人反思与改进
|
|
|
|
|
1. **深度验证**: 对HA与性能用例的覆盖需进一步加强。
|
|
|
|
|
2. **自动化程度**: 部分流程仍手工,需引入脚本化与CI/CD实践。
|
|
|
|
|
3. **监控体系**: 基础监控已建,但告警与联动策略需完善。
|
|
|
|
|
|
|
|
|
|
## 技术亮点与实践
|
|
|
|
|
|
|
|
|
|
### 亮点
|
|
|
|
|
1. **交付物精简与闭环**: 40项精简为15项核心交付物,结构清晰、可验收。
|
|
|
|
|
2. **脚本化运维**: 启停与健康检查、环境变量统一脚本,提高一致性。
|
|
|
|
|
3. **集群验证**: Web与基本功能验证到位,形成可复用检查清单。
|
|
|
|
|
|
|
|
|
|
### 量化成果
|
|
|
|
|
- 配置实例:Flume多源汇聚与日志收集2+套
|
|
|
|
|
- 验证截图:HDFS/YARN Web与基本操作验证若干
|
|
|
|
|
|
|
|
|
|
## 下周工作计划
|
|
|
|
|
|
|
|
|
|
### 主要任务
|
|
|
|
|
1. **Hadoop高可用演练**: NN切换、故障恢复与日志分析。
|
|
|
|
|
2. **Flume性能调优**: 压力测试、参数组合优化与监控联动。
|
|
|
|
|
3. **生态组件扩展**: 初步引入Hive/HBase/Spark并进行基础集成验证。
|
|
|
|
|
4. **自动化与容器化**: 规划Docker/K8s与脚本化部署的最小闭环。
|
|
|
|
|
|
|
|
|
|
### 具体安排
|
|
|
|
|
- **周一-周二**: HA演练脚本与用例执行;故障注入与恢复验证。
|
|
|
|
|
- **周三**: Flume压力测试与监控告警联动;参数迭代优化。
|
|
|
|
|
- **周四-周五**: Hive/HBase/Spark基础集成与数据流通路打通。
|
|
|
|
|
- **周六**: 自动化脚本与容器化初步方案;整理文档与演示材料。
|
|
|
|
|
- **周日**: 复盘与完善;输出集成测试报告与优化建议。
|
|
|
|
|
|
|
|
|
|
### 质量目标
|
|
|
|
|
- 验收用例全覆盖,关键路径可复现、可验证。
|
|
|
|
|
- 配置参数有据可依,监控与告警有效联动。
|
|
|
|
|
- 交付文档结构清晰、示例可运行。
|
|
|
|
|
|
|
|
|
|
## 团队协作表现
|
|
|
|
|
1. 每日同步进度与问题清单,及时分享配置与脚本。
|
|
|
|
|
2. 统一端口与权限策略,减少集成冲突。
|
|
|
|
|
3. 在分支上提交合并(`develop`→`zoujiaxuan_branch`)并推送更新,便于团队评审。
|
|
|
|
|
|
|
|
|
|
## 下周重点关注
|
|
|
|
|
|
|
|
|
|
### 技术重点
|
|
|
|
|
1. **HA与故障恢复**: 切换流程、日志分析与演练脚本。
|
|
|
|
|
2. **性能与稳定性**: Flume吞吐与延迟、参数与监控联动优化。
|
|
|
|
|
3. **生态集成**: 初步打通Hive/HBase/Spark的数据通路。
|
|
|
|
|
|
|
|
|
|
### 个人发展
|
|
|
|
|
1. **自动化意识**: 提升脚本化与CI/CD实践能力。
|
|
|
|
|
2. **体系化笔记**: 沉淀配置与演练用例为可复用模板。
|
|
|
|
|
3. **沟通与协作**: 提高问题复盘与方案输出的效率与质量。
|
|
|
|
|
|
|
|
|
|
## 项目贡献总结
|
|
|
|
|
1. 完成面向集群与数据库的核心能力闭环,为后续集成奠定基础。
|
|
|
|
|
2. 精简交付物、统一文档结构,提升评审与复用效率。
|
|
|
|
|
3. 推进分支同步与合并,保障团队协作的连续性与透明度。
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
**总结完成时间**: 2025-11-10
|
|
|
|
|
**下周重点任务**: Hadoop高可用演练与Flume性能调优
|
|
|
|
|
**个人评价**: 本周围绕三大核心任务完成既定目标,形成核心交付物的闭环结构;下周将从高可用与性能角度深化验证与优化,推动项目向生产化更进一步。
|
|
|
|
|
|