首页
关于
Search
1
图神经网络
109 阅读
2
java期末速成
46 阅读
3
CLIP
42 阅读
4
Attention2Transformer
36 阅读
5
MySQL
32 阅读
默认分类
AI
课内
技能
Search
标签搜索
AI
CS
Tools
paper
DeepLearning
python
DATA
GNN
Transformer
hadoop
晨旭不想写程序
累计撰写
24
篇文章
累计收到
23
条评论
首页
栏目
默认分类
AI
课内
技能
页面
关于
搜索到
24
篇与
的结果
2024-12-21
软件工程
一什么是软件?软件不是程序 而是程序 数据以及开发、使用和维护程序需要的所有文档的完整集合可以写作为 软件 = 程序+数据+文档程序是实现设计好的功能和性能要求执行的指令序列数据是指程序能正常处理信息的数据和数据结构文档是与程序运行和维护有关的图文资料软件生存周期软件也有一个孕育 诞生 成长 成熟 衰亡的生存过程我们称其为计算机软件的生存周期软件生存周期是借用工程中产品生存周期的概念而得来的,是指某一软件项目被提出来并着手实现开始直到该软件报废或停止使用为止可分为若干阶段计划时期问题定义可行性研究主要任务是调查和分析开发时期需求分析概要设计详细设计编码测试运行时期软件开发模型模型是为了理解事物而对事物做出的一种抽象软件开发模型就是为整个软件建立的模型瀑布模型也称生存周期模型或线性顺序模型瀑布模型将软件生存周期各个活动规定为依线性顺序连接的若干阶段的模型,包括问题定义、可行性研究、需求分析、概要设计、详细设计、编码、测试和维护。快速原型模型首先快速建立一个能够反映用户主要需求的原型系统,让用户在计算机上试用它,通过实践让用户了解未来目标系统的概貌,以便判断哪些功能是符合需要的,哪些方面需要改进,用户会提出许多改进意见增量模型增量模型也称为渐增模型,是瀑布模型的顺序特征和快速原型法的迭代特征相结合的产物,是一种非整体开发的模型软件在模型中是“逐渐”开发出来的把软件产品作为一系列的增量构件来设计、编码、组装和测试。每个构件由多个相互作用的模型构成,并且能够完成特定的功能。开发出一部分,向用户展示一部分,可让用户及早看到部分软件,及早发现问题螺旋模型加入了瀑布模型与增量模型都忽略了的风险分析,即将两种模型结合起来,弥补了两种模型的不足。它是一种风险驱动的模型二成本-效益分析成本效益分析的目的是从经济角度评价开发一个新的软件项目是否可行。系统成本包括开发成本和运行维护成本系统效益包括有形的经济效益和无形的社会效益两种通常使用利率的形式表示货币的时间价值 假设年利率为i,如果现在存入P元,则n年后可得到的钱数为F例题:投资回收期:使累计的经济效益等于最初的投资费用所需要的时间纯收入:就是在整个生存周期之内系统的累计经济效益(折合成现在值)与投资之差可行性分析的目的和任务目的:用最小的代价在尽可能短的时间内确定问题是否能够解决可行性研究的任务是,首先需要进行概要的分析研究,初步确定项目的规模和目标,确定项目的约束和限制,分析几种可能解法的利弊,从而判定原定系统的目标和规模是否现实,系统完成后带来的效益是否大到值得投资开发这个系统的程度包括方面:经济可行性、技术可行性、操作可行性和法律可行三什么是需求分析 解决什么问题是软件开发期的第一个阶段,解决的基本任务是准确地回答系统必须做什么?这个问题需求分析的任务不是确定系统怎样完成他的工作谁负责需求分析需求分析规则说明书包括什么?需求分析员编写需求规格说明书需求规格说明书明确定义目标系统的需求、系统构成及有关的接口需求说明相当于用户与开发者之间的一份技术合同,是测试验收阶段对软件进行确认和验收的基准什么是数据流图?数据流图 :一种用于描述“分解”的结构化建模工具,是一种图形化技术,用于表示系统逻辑模型,它以直观的图形清晰地描述了系统数据的流动和处理过程。是分析员与用户之间极好的通信工具。数据流图的源点或者终点,通常是系统外的实体 可以是人、物或其他软件系统;一般只出现在出现在数据流图的顶层图中加工是对数据进行处理的单元,一个处理框可以代表一系列程序、单个程序或程序的一个模块数据流是传播的路径数据存储用来存储数据,可以表示一个条件、文件的一部分、数据库的元素或者记录的一部分画DFD的四种基本符号画数据流图要注意什么注意事项例题给一个需求描述 如何画出数据流图看视频学会画图第三章PPT中的60页,有多个例题E-R基本要素(不画)实体联系图基本要素:实体型 属性 联系表示的方法为 数据对象(实体) 联系 属性给一段伪代码(if else) 用判定树判定表把代码重新翻译判定树判定表例子若年交易额4万元以上,且最近3个月无欠款的顾客,可享受10%的折扣若近3个月有欠款,是本公司5年以上老顾客,可享受5%的折扣若不是老顾客,只有2%的折扣;年订货量不足4万元者无折扣四如何度量模块的独立性两方面耦合衡量不同模块彼此间相互依赖的紧密程度。耦合要低,即每个模块和其他模块之间的关系要简单。无直接耦合 数据耦合 标记耦合数据耦合是理想的目标 维护更容易对一个模块的修改不会使另一个模块产生退化错误内聚衡量一个模块内部各个元素之间彼此结合的紧密程度的度量。 内聚要高,每个模块完成一个相对独立的特定子功能。深度宽度扇入扇出深度:软件结构中模块的层数,它表示控制的层数,在一定意义能粗略地反映系统的规模和复杂程度宽度:同一层次上模块的最大个数扇出:是一个模块直接调用的模块数目。经验证明,好的系统结构的平均扇出数一般是3-4,不能超过5-9扇入:有多少个上级模块直接调用它一般设计的比较好的软件结构 顶层扇出高 中层扇出较少 底层模块有高扇入总体设计说明书总体设计阶段产生的文档是总体设计说明书,它既是详细设计、编码的基础,也是进行测试的依据之一五程序的三种基本结构任何程序逻辑都可用顺序、选择和循环等三种基本结构详细设计的任务是什么 关键确定每个模块所采用的算法确定每个模块所使用的数据结构确定每个模块的接口细节为每个模块设计出一组测试用例关键技术是结构化程序设计用到的图形化工具程序流程图、盒图和问题分析图(PAD)等给一段伪代码 画N-S盒图和PAD图盒图 N-S图只能从上面盒子进 下面走出盒子中可以进行嵌套每个处理步骤都是用一个盒子表示的问题分析图 PAD图七什么是软件测试软件测试是保证软件质量的关键,它是对需求分析、设计和编码的最终复审黑盒测试 包括那些测试方法黑盒法是把测试对象看作一个黑盒,测试时完全不考虑程序的内部的逻辑结构与内部特性,只需根据需求规格说明书,测试程序的功能或程序的外部特性包括等价分类法 边值分类法 错误推测法测试基本过程 每步任务是什么单元测试模块接口测试 模块局部数据结构 模块出错处理通路测试 模块中重要的执行路径测试 模块边界条件测试集成测试在装配的过程中对组装的模块进行测试,主要目标是发现与接口有关的问题确认测试验证系统的功能、性能等特性是否符合 需求规格说明文档资料是否正确、完整系统的可移植性、兼容性、错误的恢复能力和易维护性是否满足系统测试与系统中的硬件、外部设备、支持软件、数据及操作人员结合起来,在实际运行环境下对计算机系统进行一系列的严格有效的测试来发现软件的潜在问题,以保证各组成部分不仅单独的正常运行,而且在系统各部分统一协调下也能正常运行静态测试被测程序不在机器上运行,对模块的源代码进行研读,查找错误或收集一些度量数据,采用人工检测和计算机辅助静态分析手段对程序进行检测,只进行特性分析动态测试通过运行程序发现错误,一般所讲的测试大多是指动态测试同测试任何产品一样设计测试样例 白盒测试以程序的结构为依据,被测对象基本上是源程序,以程序的内部逻辑结构为基础设计测试用例给一段流程图 设计用例语句覆盖运行被测程序,使得每个语句至少都能被执行一次判定覆盖不仅每个语句执行一次,每个判定的分支都至少执行一次条件覆盖不仅每个语句至少执行一次 而且使判定表达式中的每个条件都取到各种可能的结果判定/条件覆盖同时满足判定覆盖和条件覆盖条件组合覆盖选取足够多的测试数据 使得每个判定表达式中条件的各种可能组合都至少出现一次八为什么要进行软件维护为了改正软件运行错误,或者因满足新的需求而加入新功能的修改软件的过程基本流程维护工作的流程主要步骤包括建立维护机构编写软件维护申请报告确定软件维护工作流程整理软件维护文档评价软件维护性能种类改正性维护适应性维护完善性维护预防性维护九面向对象的软件工程是什么?是面向对象方法在软件工程领域的全面应用与传统的基于结构化的软件工程有什么不同?优点:与人类思维习惯一致软件稳定性好:当系统的功能需求发生变化时,仅需要做一些局部性的修改可重用性好容易开发大型软件产品:把一个大型系统分解成相互独立的小系统来处理,便于团队协作和过程管理可维护性好、易于测试不足:与面向过程语言相比,要写更多的代码占用空间比较多,程序效率比较低创建对象实例的过程往往比较耗时对系统动态特征表述不充分,且反应系统整体功能特征的能力较差面相对象方法学的四大特性(抽象、封装、继承和多态)在一定程度上避免了不合理的操作,并有效阻止了错误的扩散,但加大了测试的难度十用例之间的关系 四种包含关系扩展关系泛化关系使用关系UML图中 动态行为模型通常用的那些图建模 分别用在哪些场景建立顺序图建立通信图建立状态图建立活动图顺序图显示参与者如何采用若干顺序步骤与系统对象交互的模型通信图描述类(对象)之间的关联及其彼此之间的消息通信状态图活动图
2024年12月21日
26 阅读
1 评论
3 点赞
2024-12-08
信号与图像例题
画图题例题7例题8例题9例题10例题11例题12例题18一二章计算题、例题17例题19例题20例题21例题22例题23例题24例题25例题26差分方程笔记里有写 很麻烦的题例题25例题26例题27例题7卷积计算例题10例题13例题18单位样值响应例题19例题22例题23例题24例题25例题26 **第三章计算题例题1例题5例题6例题7例题例题8例题9例题10例题11例题12例题13例题14*这里注意复习一下卷积例题15第四章计算题例题例题1 没看懂例题2例题5 无法理解例题7例题8 *例题9第五章计算题例题1例题2例题3例题4例题5例题6例题8例题9 没理解例题10例题11例题12例题13例题14例题15图像处理题3、图像增强 图像复原 图像形态学处理 图像分割 图像表示与表述 目标识别5、例题卷积习题习题1习题2 画图习题3第三章习题习题1习题2习题3习题4习题5第四章习题习题1 画图习题2习题3第五章思考1、理想低通滤波器是指在频率域中能够完全通过低频分量,同时完全阻止高频分量的滤波器2、由于理想低通滤波器在实际应用中不可实现(其非因果性和时域无限响应),可以通过以下方式优化:使用可实现的滤波器:使用巴特沃斯滤波器或切比雪夫滤波器等接近理想低通特性的滤波器,频率响应平滑,且可实现。减少 Gibbs 现象:将理想低通滤波器的矩形响应替换为平滑的过渡函数,例如采用 Gaussian 滤波器。调整窗函数:设计有限时域的窗函数(如 Hamming 窗、Hanning 窗等)对信号进行加权,使频域响应更平滑,减少振铃效应。频率调整:根据信号实际需求选择合适的截止频率 fcf_cfc,避免过度滤波或不足滤波。3、低通滤波器: 允许低频分量通过,抑制高频分量,用于平滑信号或消除高频噪声。高通滤波器: 允许高频分量通过,抑制低频分量,用于增强信号细节或边缘检测高通滤波器可以看作低通滤波器的频域倒置版本。4、周期性噪声在频域中表现为孤立的频点:空域: 周期性噪声是一种规则重复的波形,可能呈现为条纹、栅格等。频域: 周期性噪声对应的频谱会在特定频率上产生孤立的高幅值频点,这些频点对应噪声的频率分量。原因:周期噪声是由特定频率的正弦波或余弦波叠加而成。在频域中,这些正弦波会集中在对应频率上形成孤立的频点。5、低通滤波器:Gaussian 滤波器: 平滑图像,减少噪声。Butterworth 滤波器: 平滑过渡,减少振铃效应。理想低通滤波器: 理论滤波器,用于分析。均值滤波器: 平均像素值,模糊图像,减少细节。作用:消除高频噪声。平滑图像或信号。保留大尺度的低频信息。高通滤波器:Laplacian 滤波器: 检测图像的边缘。Sobel 滤波器: 强调边缘和轮廓。Butterworth 高通滤波器: 平滑过渡,抑制低频。作用:增强边缘或细节。检测图像轮廓。去除低频分量。6、低通滤波:截止频率高: 保留更多高频细节,图像较清晰。截止频率低: 仅保留低频分量,图像变得模糊。高通滤波:截止频率高: 仅增强非常高频的细节,图像边缘弱化。截止频率低: 增强较多边缘信息,但可能带来噪声。7、图像的傅里叶变换:将图像从空间域变换到频域,得到频谱表示(通常是复数形式)。设计滤波器:根据需求(低通、高通、带通或带阻)设计频率域滤波器。滤波器与频谱相乘:通过频域乘法实现滤波,将滤波器的频率响应应用于图像的频谱。傅里叶逆变换:对经过滤波的频谱进行傅里叶逆变换,返回空间域得到处理后的图像。后处理:对图像进行调整,例如归一化或去除噪声等。作业题复数表示波形图绘制周期计算平均功率求能量平移变换求函数绘制波形图门函数判断周期序列 *确定基波周期画出离散信号波形图
2024年12月08日
13 阅读
0 评论
3 点赞
2024-12-02
图像与信号
第一章 信号与系统信号信息的表现形式与传送载体,而信息则是蕴含在信号中的具体内容模拟信号/连续信号在电学领域中,通过电流或电压对真是信号进行连续的直接的记录 模拟其变化过程得到的信号称为模拟信号或连续信号数字信号将信号转换成数字形式进行存储和处理单位时间内仅能选取有限数量的信号值信号值只能以有限位数的形式进行存储,保留有限的精度前者对应自变量的离散化 过程称为抽样后者对应信号值的离散化 一般涉及量化与编码模数转换器将模拟信号转换成数字信号系统在领域内特指 系统特质对信号产生影响的装置或算法通信系统广义上说 一切信息的传输过程都可以看成通信 一切完成信息传输任务的 系统都是通信系统通信系统包含 发射机 信道 和接收机发射机将信源产生的携带消息的信号转换成适合于在信道中传输的发射信号接收机功能与发射机相反,作用是对接受信号进行处理,将其还原成消息传送到信宿调制将原始信号转换成适合于在信道中传输的发射信号的过程解调从已调制的接受信号中还原出原始信号的过程信道传送信息的通道通信系统模拟通信系统和数字通信系统信号处理是指按照某种需要或目的,对信号进行特定的操作、加工、提炼和修改等系统分析是指对于给定的系统,研究系统对输入信号(也称激励信号)所产生的输出信号(也称响应信号),并由此获得对系统功能和特性的认知。系统综合指对于特定信号及处理要求,研究系统应具有的功能和特性,并据此设计所需的系统。系统分析是系统综合的基础。连续信号 离散信号周期信号在全时域内具有周而复始特性的信号能量信号、功率信号频域分析方法将信号分解为不同的频率分量 研究系统对不同频率分量的幅度和相位响应特性以角频率为自变量 以幅度和相位为因变量 在频域对信号与系统的特征进行分析复频域分析方法引入衰减因子对信号和系统进行分析特点是可以在复平面上以零、极点的分布特点快速判断信号和系统的多重特性系统分析给定激励和起始条件,根据描述系统的模型求系统的响应响应划分零输入响应 与 零状态响应自由响应 与 强迫响应暂态响应 与 稳态响应零输入响应没有外加激励信号的作用,只由起始状态(起始时刻系统储能)所产生的响应零状态响应不考虑原始时刻系统储能的作用(起始状态等于零),由系统的外加激励信号产生的响应研究零状态响应的意义大量的通信与电子系统实际问题只需研究零状态响应可以采用卷积的方法求解零状态响应通过输入和输出之间的关系来辨识系统和研究系统自身的特性带宽频带宽度简称带宽 表示信号频谱的集中程度信号可以用某段频率范围的信号来表示 此频率范围称为频带宽度理想低通是能够实现以某一特定的截止频率为界 对这一频率的信号进行无失真传输 而对高于此频率的信号完全抑制调制解调调制是把信号的频谱搬移到任何所需的较高频段上的过程解调是把较高频段上的信号搬移会原频段并恢复的过程频率域锐化消除模糊 突出边缘图像被记录的所有具有视觉效果的画面都可以称为图像数字图像完全是用数字(即计算机存储的数据)来记录图像各点的亮度信息 数字图像是由模拟图像经过数字化或离散化得到的 组成数字图像的基本单位是像素模拟图像通过某种物理量(光电等)的强弱变化来记录图像上各点的亮度信息 如模拟电视图像 自然图像是连续的数字图处理数字图像处理可以对图像数据进行变换 编码和压缩 便于机器对图像存储和传输特点包括:处理信息量大 占用频带较宽 像素之间相关性大 无法复现全部信息 受人的因素影响较大低级图像处理输入是图像 输出也是图像中级图像处理输入是图像 输出是表示图像特征的数值或符号高级图像处理输入是数值或符号 输出是对图像的理解结果 图像理解狭义的图像处理是底层操作 主要在图像像素级上进行处理图像增强是指对较低质量的图像 利用特征提取等手段 对图像的信息进行增强 改善图像质量 进一步突出图像中的有用信息空域处理是在图像空域平面进行处理 对图像的像素灰度进行直接处理滤波利用图像的邻域或者图像的频率成分实现对图像进行处理滤波器在图像滤波过程中 邻像素组合过程中使用的权重函数图像平滑本质是基于空域积分运算图像锐化本质是基于空域微分运算为什么要在频率域研究图像增强
2024年12月02日
14 阅读
0 评论
2 点赞
2024-11-20
数据挖掘
大数据挖掘数据挖掘数据挖掘定义技术层面:数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中、人们事先不知道的、但又包含潜在有用的信息的过程。数据准备环节数据选择 质量分析 数据预处理数据仓库从多个数据源搜集的信息存放在一致的模式之下特征化对目标数据的一般特性和特征汇总聚类分析最大化类内相似度 最小化类间相似性数据准备大数据定义超出正常处理范围 由海量数据+复杂类型的数据 构成数据对象组成数据集的元素,每个数据对象均为一个实体数据对象由属性描述数据存在问题数据不完整存在噪声数据数据不一致数据冗余数据不平衡数据的正确性分析缺失值数据错误度量标准错误编码不一致处理缺失数据忽视较小缺失率 有缺失值的样本或属性人工补全缺失值重新采样领域知识自动补全缺失值固定值均值基于算法插补法均值插补回归插补极大似然估计噪声过滤回归法均值平滑法离群点分析处理噪声数据局部离群因子LOF计算数据量子集选择数据量太大减小时间复杂度数据聚合尺度变换数据更稳定调整类分布不平衡数据哈尔小波交换通过调整分辨率数据标准化最小最大标准化Z-score标准化大数据挖掘与分析邻近性相似性和相异性统称为邻近性数据矩阵存放数据对象相异性矩阵存放数据对象的相异性值二元属性邻近性数值数据距离闵可夫斯基距离h=1 2 正无穷维度诅咒基于距离的聚类在高纬度下无效在高维情况下 P(0,1)更有效逆文档频率IDF 或 Goodall度量基本思路:将基本词汇看做全部属性的集合 每个词频是属性的值余弦度量余弦相似度逆文档频率 阻尼系数累计距离矩阵(大概率)计算等图算法题目APRIORI基本的Apriori算法 Apriori算法的基本思路是采用层次搜索的迭代方法,由候选(k-1)-项集来寻找候选k-项集,并逐一判断产生的候选k-项集是否是频繁的。 设C k 是长度为k的候选项集的集合,L k 是长度为k的频繁项集的集合。为了简单,设最小支持度阈值min_sup为最小元组数,即采用最小支持度计数。输入:事务数据库D,最小支持度阈值min_sup。 输出:所有的频繁项集集合L。 方法:其过程描述如下:通过扫描D得到1-频繁项集L1; for (k=2;Lk-1!=Ф;k++) { Ck=由Lk-1通过连接运算产生的候选k-项集; for (事务数据库D中的事务t) { 求Ck中包含在t中的所有候选k-项集的计数; Lk={c | c∈Ck and c.sup_count≥min_sup}; //求Ck中满足min_sup的候选k-项集 } } return L=∪kLk;这是通过Apriori计算最大频繁项集 和 计算强关联规则的题目要求为超过最小支持度 最小支持度的计算很简单即为Apriori优化基于散列的Apriori基于散列的Apriori技术基于Apriori算法, 为了解决此算法在数据集较大的情况下候选项集数量爆炸的问题 以及支持度计数效率低下的问题基于散列的优化:在生成候选项集时,通过哈希函数映射分桶 每个桶记录频数 如果桶中的频数小于最小支持度的阈值 则该桶中所有项集可以直接剪枝因为通过哈希函数可以快速找到相应的桶,所以计算效率较高h(x,y)=(hash(x)+hash(y))modn哈希树分组算法题目FPgrowth条件模式基的寻找在FPtree的项目里倒着找,沿着虚线将出现的频次进行统计,,写出条件模式基条件FP Tree沿着条件模式基画FP Tree 记得剪去最小支持度不够的项频繁项集将条件FPtree与项进行组合 得到频繁项集列式计数Apriori算法使用垂直数据格式挖掘频繁项集关联模式挖掘超集包含了另一个集合中所有元素的集合为超集闭模式一个频繁项集 没有任何它的超集具有与他相同的支持度也就是不被冗余覆盖的核心模式闭模式显著减少了需要存储的频繁模式数量可以推导出所有频繁模式及其支持度极大模式没有频繁的超集极大模式只保留频繁模式中“最大”的部分无法还原所有频繁模式的支持度信息序列模式序列模式是指诸如此类的模式,其项中包含多个项,在计数时,相同项仅计数一次聚类好的聚类方法产生高质量的聚类结果要求高类内相似性 高内聚低类间相似性 低耦合能够发掘隐藏模式 有价值聚类的好坏在于:相似度测量方法不同尺度 不同类型的距离函数设计不同主要聚类方法基于代表点的聚类代表性方法:kmeans kmedians kmedoids CLARANS层次方法基于准则对数数据层次分解代表性方法:Diana Agnes BIRCH CAMELEON基于密度的方法代表性方法:DBSACN OPTICS DENClue基于网格的方法代表方法:STING WaveCluster CLIQUE基于模型的方法代表性方法:EM SOM COBWEB聚类评估方法(概率低)熵不考哈熵 :可以反馈特征子集的聚类质量经验法肘方法交叉验证基于代表点聚类K meanskmedians选取代表点选取中值 对异常点不那么敏感Kmedoids从非代表点中随机选取点代替中心点集合中的某个点,重新划分 诸葛尝试 选择最优PAM1不受离群点数据影响2适于处理小数据集CLARA(小概率)基于抽样的方法 找到最优中心点集为目标CLAEANS(小概率)采样并随机选择层次聚类AGNES凝聚法不断将簇进行合并 最后得到所有合并后的集合为止DIANA法分裂法BirchCHAMELEON基于密度聚类发现任意形状簇Discover clusters of arbitrary shape能容忍噪音Handle noise一边扫描One scan需要以密度相关的参数作为终止条件DBSCAN原理: 对象的密度可以用靠近该对象的节点数量表示。 找出核心对象和其邻域,形成稠密区为簇参数:Eps : 邻域半径MinPts : 邻域半径内的最小节点数 判断是否为核心节点的阈值核心节点q 满足|N_Eps (q) | ≥ MinPts核心节点扩展区域 边缘节点定义边界或者OPTICS(可能不考)定义了两种距离,核心距离与可达距离对于不同对象可能有不同的可达距离DENCLUE(大概率不考)引入影响函数与密度函数的概念进行聚类离群点检测离群点Outlier:以一种不同机制产生的不同于大多数据表现的不正常的数据。如:虚假行为,电信诈骗,医药分析,网络攻击,等。与噪音数据区别噪音数据是错的数据是一个测量变量中的随机错误或误差 包括错误的值 偏离期望的孤立点噪音数据在数据处理前已经被移除。分类全局离群点情境(条件)离群点今天的最高温度是-15度集体离群点数据对象的子集形成集体离群点例如:一些计算机之间频繁发送信息离群点特征有趣的 少量的基于离群点方法检测出的离群点不能对应真正的异常行为只能为用户提供可疑数据基于密度的方法直方图通过直方图找到核密度估计确定数据中的稀疏区域以便报告异常点基于概率的方法极值:对应概率分布的统计尾部识别模型低概率区域中的对象一元离群点检测根据概率密度函数进行基于距离的方法基本思路数据集中显著偏离其他对象的点根据每个点在局部区域上的密度和其邻近点的密度来判断异常程度基于聚类的方法检测方法建立正常模型离群点为不能正常符合这个模型的数据点将异常数据度量为数值分数越大越可能是离群点形式基于聚类产生簇寻找远离簇的数据点考虑对象和它最近簇之间的距离半监督学习结合聚类与分类检测离群点先基于聚类识别正常簇,然后使用这个簇的一类模型识别离群点
2024年11月20日
12 阅读
0 评论
1 点赞
2024-11-10
aaa
https://neo4j.com/artifact.php?name=neo4j-community-3.5.13-unix.tar.gz
2024年11月10日
17 阅读
0 评论
0 点赞
1
2
...
5