分享
Oracle数据库健康检查与评估.doc
下载文档

ID:107916

大小:447.50KB

页数:28页

格式:DOC

时间:2023-02-24

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
Oracle 数据库 健康 检查 评估
XXXXXXXXXXXXXXX XXXXX Oracle数据库健康检查与评估 XXXX 巡检人: 报告生成日期: yyyy-mm-dd ii Joint Contact Guide v3.0 Commercial in Confidence Page ii 文档控制 此文档仅供江苏移动审阅,不得向与此无关的个人或机构传阅或复制。 修改记录 日期 作者 版本 修改记录 分发者 、姓名 职位 审阅记录 姓名 职位 相关文档 目录 文档控制 2 修改记录 2 分发者 2 审阅记录 2 相关文档 2 目录 3 1. 检查介绍 5 1.1 检查系统 5 1.2 检查范围 5 2. 硬件配置 7 2.1 主机配置 7 3. 系统配置 8 3.1 操作系统数据库相关要求补丁 8 3.2 硬盘可用空间 8 3.3 CPU 利用率 8 4. 数据库配置 10 4.1 数据库版本和单独补丁 10 4.2 CRS版本和单独补丁 10 4.3 ORACLE CLUSTER配置 10 4.4 数据库产品选项 10 4.5 初始化参数文件 11 4.6 CRS日志文件 11 4.7 RDBMS运行日志和跟踪文件 11 4.8 控制文件 11 4.9 Redo log 文件 12 4.10 归档Redo log 文件 13 4.11 数据文件 13 4.12 表空间 14 4.13 回滚段管理 15 5. 数据库简单风险评估 17 5.1 安全性管理 17 6. SqlNet 概况 18 6.1 监听器Listener 18 6.2 SQL*Net 18 6.3 TNSNAMES 18 7. 数据库性能 19 7.1 数据库各项基于时间模型的统计信息 19 7.2 数据库负荷压力分析 20 7.3 各项命中率 21 7.4 等待事件 21 7.5 统计信息分析 21 7.6 数据库I/O性能 22 7.7 索引/行迁移/行链 22 7.8 Enqueue等待分析 23 7.9 Latch分析 23 7.10 Resource Limit分析 23 7.11 Top SQL语句 24 8. 数据库备份策略评估 25 8.1 备份 25 8.2 恢复 25 9. 数据库特别关注点检查 26 10. 检查总结 27 附录:初始化参数 28 数据库所有非默认值的参数: 28 1. 检查介绍 1.1 检查系统 系统主要包括1个数据库,具体情况如下: 数据库名称 数据库实例名 应用名称 应用类型OLTP/DSS/Batch 开发工具 应用简介 RDBMS 版本 CRS 版本 所有数据文件所占磁盘空间 SGA target size DB_BLOCK Size 表空间个数 数据文件个数 控制文件个数 日志文件大小 日志组数目 每组日志文件成员数量 归档方式 并发用户量 性能需求 1.2 检查范围 本次检查仅限于数据库。在这次检查中对数据库配置和数据库性能进行了分析。本报告提供的检查和建议不涉及具体的安全分析和应用程序的具体细节。 以下提请注意:本次检查仅历时1天,其中还包括了提交分析报告的时间,所以在具体的应用程序性能方面并不加以深入。 检查方面 具体检查内容 硬件配置 主机配置 共享内存参数 信号量 操作系统中与数据库相关主要参数 操作系统数据库相关要求补丁 系统配置 硬盘可用空间 CPU利用率 数据库版本 数据库配置 数据库产品选项 数据库参数 运行日志和跟踪文件 控制文件 Redo log文件 归档Redo log文件 数据文件 表空间 回滚段管理 安全性管理 数据库简单风险评估 监听器的设置 数据库sql*net配置 SQL*Net设置 TNSNAMES设置 数据库各项命中率 数据库性能 等待事件 AWR统计信息分析 数据库I/O性能 索引/行迁移/行链接 Sort信息统计 Enqueue等待分析 Latch分析 Resource Limit分析 Top SQL 语句 备份 恢复 数据库备份策略评估 根据客户要求只能检查一项 数据库特别关注点检查 2. 硬件配置 以下列出系统主机的主要配置情况 2.1 主机配置 机器名 用途 (Prod, Test, Development) 所在城市,物理位置(机房,远程) 操作系统及版本 内存 cpu 建议: 目前系统配置满足数据库要求,操作系统参数设置合理。 3. 系统配置 和数据库相关的操作系统配置将被检查,包括以下方面: l 操作系统数据库相关要求补丁 l 存放oracle文件的硬盘区可用空间(oracle文件包括:数据文件,控制文件,在线redo logs,归档redo logs,运行情况文件和跟踪文件)。 l 硬盘利用率。 l CPU利用率。 3.1 操作系统数据库相关要求补丁 建议: 3.2 硬盘可用空间 硬盘可用情况如下示: 数据库XXXX的硬盘使用率情况如下: Filesystem kbytes used avail %used Mounted on 数据库YYYY的硬盘使用率情况如下: Filesystem kbytes used avail %used Mounted on 建议: 目前该数据库服务器中还没有其他硬盘空间使用率超过90%的分区。如果有需要引起注意并且及时增加硬盘空间的容量。 3.3 CPU 利用率 CPU利用率的统计时间是:yyyy-mm-dd hh:mi---- yyyy-mm-dd hh:mi 1. top / glance 2. vmstat 2 20 参考值: 1. 最大CPU使用率:60%--70% 2. 系统进程与用户进程占用CPU最大比率:40/60 数据库XXXX: 数据库YYYY: 从上述的情况中看出,数据库:服务器CPU idle基本在75%以上,CPU资源较为空闲。 建议: 当CPU的使用率超过80%,要注意监控是否有僵死进程,如果有僵死进程占用CPU,需要将僵死进程kill掉。如果有正常进程占用大量CPU,需要查看是否属于正常业务进程等。 4. 数据库配置 本次检查工作主要针对数据库XXXX。 4.1 数据库版本和单独补丁 目前已经安装的单独补丁列表如下: opatch lsinventory -oh $ORACLE_HOME Patch Base Bug(s) Installed on 建议: 4.2 CRS版本和单独补丁 CRS安装单独补丁列表如下: opatch lsinventory -oh $ORA_CRS_HOME Name Version Installed on 建议: 4.3 ORACLE CLUSTER配置 OCR使用和备份都正常。相关CRS的资源和服务都正常。 $ olsnodes $ ocrcheck $ ocrconfig -showbackup $ crsctl check crs CSS appears healthy CRS appears healthy EVM appears healthy $ crs_stat -t 4.4 数据库产品选项 当oracle软件安装时,会选择要安装的产品。有某些产品的安装是需要license的,本次检查不涉及license问题。一般,很多系统安装的数据库产品选项根本未被使用。以下列出的安装产品选项可供未来的应用开发参考,或是可以被确认有哪些产品选项未在原计划之内。 以下是数据库安装的产品选项: Parameter Value 4.5 初始化参数文件 数据库SPFILE参数指定了当前使用的数据库配置参数,在数据库启动时被使用。在附录A列出了数据库所有的非默认值的参数。 建议: 1. 数据库的参数可以看出大部分都是经过精心设置的。 2. 建议调整的参数值,请在测试环境数据库中测试确认之后,再调整于生产环境数据库。 4.6 CRS日志文件 从Oracle 10g RAC版本开始,新增加CRS组件。CRS对于RAC使用是必不可少,因此crs的稳定对于RAC数据库的正常运行至关重要。在健康检查中会检查CRS、CSS和EVM的LOG信息。 . 建议: 2.检查CRS其他相关进程日志,没有发现问题。 4.7 RDBMS运行日志和跟踪文件 Oracle 数据库进程生成跟踪文件来记录错误或冲突,这些跟踪文件可以用来进一步分析问题。数据库参数'max_dump_file_size'限制了这些跟踪文件的大小(以操作系统块的大小为单位)。应当有足够的硬盘空间来容纳最大值的设置,否则的话应当修改上述参数的设置。 如果参数'max_dump_file_size'设得太大,会超过硬盘空间容量;如果设得太小,又不能容纳足够的出错信息供oracle 支持服务部门分析问题。此参数可以在数据库会话级设置,这样可以有选择性地设置较大值。 注意每天监控运行日志文件中的出错信息,以便于在问题还是隐患的时候及时发现并解决掉。建议每月初将当前的alert.log重新命名以作备份,同时也可以避免alert.log文件变得太大不易管理。 在数据库:实例的运行日志文件发现的最近一月内的主要错误如下所示: 建议: 4.8 控制文件 每个数据库至少有一个控制文件。控制文件记录了数据库的物理结构及同步信息。 Control file location 控制文件路径如下: Name Status 目前所有的控制文件文件存储在已经做了硬件RAID的磁盘阵列上面,提供了硬件级别的保护。 建议 : 4.9 Redo log 文件 对于恢复操作,最为关键的结构是在线Redo Log。在线Redo Log一般由两个或两个以上预先分配的存储数据库变化的文件组成。为了防止例程故障,每个数据库的实例都有相关的在线Redo Log。 每个数据库至少有两个Redo Log组,每组至少有一个日志文件。Oracle的多重在线Redo Log文件可以确保在线日志文件的安全。对于多重在线Redo Log文件,LGWR同时将相同的Redo Log信息写入不同的Redo Log文件中,从而减少单个文件丢失的损失。 当Oracle无法访问一个Redo Log文件时,这个文件状态变为INVALID。当Oracle推测一个Redo Log文件不完整或者不正确时,它的状态变为STALE。当一个STALE的文件被重用时,即其所在日志文件组活动时,此文件也能够使用。 在线Redo Log文件减少了数据库数据丢失的损失,比如当发生例程故障时,没有被写入数据文件的数据可以从在线Redo Log文件中恢复。 Group # Thread # Sequence # Bytes Members Archived Status First

此文档下载收益归作者所有

下载文档
收起
展开