首页
关于
Search
1
图神经网络
68 阅读
2
java期末速成
30 阅读
3
CLIP
29 阅读
4
Attention2Transformer
26 阅读
5
MySQL
23 阅读
默认分类
AI
课内
技能
Search
标签搜索
AI
CS
Tools
paper
DeepLearning
python
DATA
GNN
Transformer
hadoop
晨旭不想写程序
累计撰写
22
篇文章
累计收到
13
条评论
首页
栏目
默认分类
AI
课内
技能
页面
关于
搜索到
6
篇与
的结果
2024-12-02
图像与信号
第一章 信号与系统信号信息的表现形式与传送载体,而信息则是蕴含在信号中的具体内容模拟信号/连续信号在电学领域中,通过电流或电压对真是信号进行连续的直接的记录 模拟其变化过程得到的信号称为模拟信号或连续信号数字信号将信号转换成数字形式进行存储和处理单位时间内仅能选取有限数量的信号值信号值只能以有限位数的形式进行存储,保留有限的精度前者对应自变量的离散化 过程称为抽样后者对应信号值的离散化 一般涉及量化与编码模数转换器将模拟信号转换成数字信号系统在领域内特指 系统特质对信号产生影响的装置或算法通信系统广义上说 一切信息的传输过程都可以看成通信 一切完成信息传输任务的 系统都是通信系统通信系统包含 发射机 信道 和接收机发射机将信源产生的携带消息的信号转换成适合于在信道中传输的发射信号接收机功能与发射机相反,作用是对接受信号进行处理,将其还原成消息传送到信宿调制将原始信号转换成适合于在信道中传输的发射信号的过程解调从已调制的接受信号中还原出原始信号的过程信道传送信息的通道通信系统模拟通信系统和数字通信系统
2024年12月02日
2 阅读
0 评论
0 点赞
2024-11-20
数据挖掘
大数据挖掘数据挖掘数据挖掘定义技术层面:数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中、人们事先不知道的、但又包含潜在有用的信息的过程。数据准备环节数据选择 质量分析 数据预处理数据仓库从多个数据源搜集的信息存放在一致的模式之下特征化对目标数据的一般特性和特征汇总聚类分析最大化类内相似度 最小化类间相似性数据准备大数据定义超出正常处理范围 由海量数据+复杂类型的数据 构成数据对象组成数据集的元素,每个数据对象均为一个实体数据对象由属性描述数据存在问题数据不完整存在噪声数据数据不一致数据冗余数据不平衡数据的正确性分析缺失值数据错误度量标准错误编码不一致处理缺失数据忽视较小缺失率 有缺失值的样本或属性人工补全缺失值重新采样领域知识自动补全缺失值固定值均值基于算法插补法均值插补回归插补极大似然估计噪声过滤回归法均值平滑法离群点分析处理噪声数据局部离群因子LOF计算数据量子集选择数据量太大减小时间复杂度数据聚合尺度变换数据更稳定调整类分布不平衡数据哈尔小波交换通过调整分辨率数据标准化最小最大标准化Z-score标准化大数据挖掘与分析邻近性相似性和相异性统称为邻近性数据矩阵存放数据对象相异性矩阵存放数据对象的相异性值二元属性邻近性数值数据距离闵可夫斯基距离h=1 2 正无穷维度诅咒基于距离的聚类在高纬度下无效在高维情况下 P(0,1)更有效逆文档频率IDF 或 Goodall度量基本思路:将基本词汇看做全部属性的集合 每个词频是属性的值余弦度量余弦相似度逆文档频率 阻尼系数累计距离矩阵(大概率)计算等图算法题目APRIORI基本的Apriori算法 Apriori算法的基本思路是采用层次搜索的迭代方法,由候选(k-1)-项集来寻找候选k-项集,并逐一判断产生的候选k-项集是否是频繁的。 设C k 是长度为k的候选项集的集合,L k 是长度为k的频繁项集的集合。为了简单,设最小支持度阈值min_sup为最小元组数,即采用最小支持度计数。输入:事务数据库D,最小支持度阈值min_sup。 输出:所有的频繁项集集合L。 方法:其过程描述如下:通过扫描D得到1-频繁项集L1; for (k=2;Lk-1!=Ф;k++) { Ck=由Lk-1通过连接运算产生的候选k-项集; for (事务数据库D中的事务t) { 求Ck中包含在t中的所有候选k-项集的计数; Lk={c | c∈Ck and c.sup_count≥min_sup}; //求Ck中满足min_sup的候选k-项集 } } return L=∪kLk;这是通过Apriori计算最大频繁项集 和 计算强关联规则的题目要求为超过最小支持度 最小支持度的计算很简单即为Apriori优化基于散列的Apriori基于散列的Apriori技术基于Apriori算法, 为了解决此算法在数据集较大的情况下候选项集数量爆炸的问题 以及支持度计数效率低下的问题基于散列的优化:在生成候选项集时,通过哈希函数映射分桶 每个桶记录频数 如果桶中的频数小于最小支持度的阈值 则该桶中所有项集可以直接剪枝因为通过哈希函数可以快速找到相应的桶,所以计算效率较高h(x,y)=(hash(x)+hash(y))modn哈希树分组算法题目FPgrowth条件模式基的寻找在FPtree的项目里倒着找,沿着虚线将出现的频次进行统计,,写出条件模式基条件FP Tree沿着条件模式基画FP Tree 记得剪去最小支持度不够的项频繁项集将条件FPtree与项进行组合 得到频繁项集列式计数Apriori算法使用垂直数据格式挖掘频繁项集关联模式挖掘超集包含了另一个集合中所有元素的集合为超集闭模式一个频繁项集 没有任何它的超集具有与他相同的支持度也就是不被冗余覆盖的核心模式闭模式显著减少了需要存储的频繁模式数量可以推导出所有频繁模式及其支持度极大模式没有频繁的超集极大模式只保留频繁模式中“最大”的部分无法还原所有频繁模式的支持度信息序列模式序列模式是指诸如此类的模式,其项中包含多个项,在计数时,相同项仅计数一次聚类好的聚类方法产生高质量的聚类结果要求高类内相似性 高内聚低类间相似性 低耦合能够发掘隐藏模式 有价值聚类的好坏在于:相似度测量方法不同尺度 不同类型的距离函数设计不同主要聚类方法基于代表点的聚类代表性方法:kmeans kmedians kmedoids CLARANS层次方法基于准则对数数据层次分解代表性方法:Diana Agnes BIRCH CAMELEON基于密度的方法代表性方法:DBSACN OPTICS DENClue基于网格的方法代表方法:STING WaveCluster CLIQUE基于模型的方法代表性方法:EM SOM COBWEB聚类评估方法(概率低)熵不考哈熵 :可以反馈特征子集的聚类质量经验法肘方法交叉验证基于代表点聚类K meanskmedians选取代表点选取中值 对异常点不那么敏感Kmedoids从非代表点中随机选取点代替中心点集合中的某个点,重新划分 诸葛尝试 选择最优PAM1不受离群点数据影响2适于处理小数据集CLARA(小概率)基于抽样的方法 找到最优中心点集为目标CLAEANS(小概率)采样并随机选择层次聚类AGNES凝聚法不断将簇进行合并 最后得到所有合并后的集合为止DIANA法分裂法BirchCHAMELEON基于密度聚类发现任意形状簇Discover clusters of arbitrary shape能容忍噪音Handle noise一边扫描One scan需要以密度相关的参数作为终止条件DBSCAN原理: 对象的密度可以用靠近该对象的节点数量表示。 找出核心对象和其邻域,形成稠密区为簇参数:Eps : 邻域半径MinPts : 邻域半径内的最小节点数 判断是否为核心节点的阈值核心节点q 满足|N_Eps (q) | ≥ MinPts核心节点扩展区域 边缘节点定义边界或者OPTICS(可能不考)定义了两种距离,核心距离与可达距离对于不同对象可能有不同的可达距离DENCLUE(大概率不考)引入影响函数与密度函数的概念进行聚类离群点检测离群点Outlier:以一种不同机制产生的不同于大多数据表现的不正常的数据。如:虚假行为,电信诈骗,医药分析,网络攻击,等。与噪音数据区别噪音数据是错的数据是一个测量变量中的随机错误或误差 包括错误的值 偏离期望的孤立点噪音数据在数据处理前已经被移除。分类全局离群点情境(条件)离群点今天的最高温度是-15度集体离群点数据对象的子集形成集体离群点例如:一些计算机之间频繁发送信息离群点特征有趣的 少量的基于离群点方法检测出的离群点不能对应真正的异常行为只能为用户提供可疑数据基于密度的方法直方图通过直方图找到核密度估计确定数据中的稀疏区域以便报告异常点基于概率的方法极值:对应概率分布的统计尾部识别模型低概率区域中的对象一元离群点检测根据概率密度函数进行基于距离的方法基本思路数据集中显著偏离其他对象的点根据每个点在局部区域上的密度和其邻近点的密度来判断异常程度基于聚类的方法检测方法建立正常模型离群点为不能正常符合这个模型的数据点将异常数据度量为数值分数越大越可能是离群点形式基于聚类产生簇寻找远离簇的数据点考虑对象和它最近簇之间的距离半监督学习结合聚类与分类检测离群点先基于聚类识别正常簇,然后使用这个簇的一类模型识别离群点
2024年11月20日
3 阅读
0 评论
0 点赞
2024-11-07
计算机网络期末复习
计算机网络计算机网络概念篇小碎点互联网服务提供者ISP ,可以是中国电信、中国移动、中国联通1Byte = 8 bit表示速率时 k = $10^3$表示数据量时 K = $2^{10}$数据量一般是KB 速率一般是kb/s总时延 = 发送时延+传播时延+处理时延+排队时延按照传输方向分类单工:只能单方向双工:在同一时间,线路上只能允许一个方向的数据通过全双工:双方可以同时进行数据通信OSI参考模型工作原理:应用层通过应用进程交互完成特定网络应用 交互的数据单元为报文运输层为两台主机中进程之间的通信提供数据传输服务 网络层为分组交换网上的不同主机提供通信服务 使用分组或数据报为数据单元数据链路层在相邻接点之间传送数据帧物理层实现比特传输物理层单位:bit 利用传输介质,网络结点之间建立数据链路层单位:帧 物理层基础上,提供节点到节点之间的服务,差错检测、流量控制网络层单位:分组 数据链路层基础上提供点到点之间的通信,提供路由功能,拥塞控制、网络互联传输层提供端到端之间的数据传输服务,实现对数据进行控制与操作的功能会话层负责维护通信中两个节点之间的会话建立维护和断开以及数据的交换表示层用于处理交互数据的表示方式,例如格式转换、数据加密与解密,数据压缩等功能应用层使用应用程序通过网络服务TCP/IP参考模型网络接口层物理层和数据链路层网际层网络层传输层传输层应用层会话层 表示层 应用层物理层四大特性机械特性 电气特性 功能特性 过程特性调制将任意信号转化为模拟信号编码将任意信号编码为数字信号传输介质双绞线屏蔽双绞线 STP抗干扰强、贵一些非屏蔽双绞线 UTP便宜、抗干扰差光纤单模光纤多模光纤(Multi Mode Fiber) - 芯较粗(50或62.5μm),可传多种模式的光。距离:2KM多模光纤单模光纤(Single Mode Fiber):中心纤芯很细(芯径一般为9或10μm),只能传一种模式的光。因此,其模间色散很小,适用于远程通讯,但还存在着材料色散和波导色散,这样单模光纤对光源的谱宽和稳定性有较高的要求,即谱宽要窄,稳定性要好。距离:100KM复用技术频分 时分 码分 波分传输方式基带传输:传输数字信号频带传输:传输模拟信号ICMP控制报文协议 是TCP/IP的子协议,用于在主机、路由器之间传递控制消息控制消息是指网络通不通,主机是否可达Ping的过程实际上就是ICMP协议工作的过程ARPIP地址解析成MAC地址虚电路面向连接进行数据传输,类似线路交换,但是并没有物理的电路建立虚拟电路后 沿着相同的VC传输 发收顺序完全相同 传输完毕后进行释放较适合站点之间大批量的数据传输冲突域冲突域就是所有节点竞争同一带宽 一般认为一个集线器就是一个冲突域交换机上一个连接就是一个冲突域
2024年11月07日
2 阅读
0 评论
0 点赞
2024-09-21
hadoop学习报错解决
报错解决
2024年09月21日
8 阅读
0 评论
1 点赞
2024-06-02
java期末速成
javajdk jre jvm.java-------->.class----jvm---->机器语言编写源文件 编译源文件生成字节码 加载运行字节码java语句执行顺序 顺序 选择 循环 异常处理基本语法方法格式权限修饰符 返回值声明 方法名称(参数列表){ 方法中封装的逻辑功能; return 返回值; }--权限修饰符--注释//单行注释 /* 多行注释 */ /** 文档注释 **/标识符举例java变量java是一个强类型语言 必须先声明类型后使用java数据类型分两大类 基本数据类型与引用类型引用数据类型:string 数组 接口 类按照声明位置进行定义分为局部变量与成员变量变量的类型转换boolean类型不参与转换自动类型转换容量小的类型自动转换成容量大的类型byte,short,int -> float -> long ->doublebyte short int之间不会互相转换 三者计算时会转化成int类型强制类型转换容量大的类型转换成容量小的类型时需要加上强制转换符变量的作用域在类体内定义的变量称为成员变量 作用域是整个类在一个方法或方法内代码块中定义的变量称为局部变量常量量前加一个final变量赋值注意事项:float a = 133f long a = 22220202l char c = '羊'数组数组初始化方式不允许在前面的[]里写元素个数动态两种int[][] arr = new int[3][]; arr[0] = new int[3] int [][] arr2 = new int[3][2] arr[0][0] = 33静态一种int arr4[][] = new int[][]{{1,2,3},{2,3,4}}arr.length 得到数组长度输入输出scanner类型#输入 Scanner s = new Scanner(System.in); s.nextInt(); s.nextLine(); s.nextfloat(); scanner.next(); #输出 System.out.println("XX");system.out. print() 普通输出 printf()格式化输出 println()换行输出类与对象封装继承多态我们进行一次举例public class Student { private String username; public String getUsername{ return username; } #这个函数存在而不使用直接赋值的意义就是因为username这个变量是私有的 public void setUsername(String username){ this.username = username; } } class Test { public static void main(String[] args) { Student student=new Student(); student.setUsername("张三"); student.getUsername(); System.out.println(); } }类的实例化通过new语句进行创建类的定义格式[修饰符] class 类名 [extends 父类名] [implements 接口名]{ //类体 包括类的成员变量与成员方法 }继承基类object没有选择继承的时候默认继承object,有很多自带方法继承格式public class Parent { private int age; public int getAge() { return age } public void setAge(int age) { this.age = age; } #有参 public Parent(int age){ this.age = age; } #无参 public Parent(){ } public void myprint(){ system.out.println("我是父类的myprint方法"); } } class Son extents Parent{ public static void main(String[]args) { Son son = new son(); son.age = 3; } }类的重写对相同的函数进行再次声明就可以进行重写类的封装将类的某些信息隐藏在内部,不允许直接访问而是提供get set方法public class Person { private intn age; private string name; public String getName(){ return name; } public int getAge(){ return age; } public void setName(String name){ this.name = name; } public void setAge(int age){ this.age = age; } }构造方法 重点构造方法定义主要用来创建对象时 初始化对象的 总与new一起使用在创建对象的运算符中 一个类可以有 多个构造函数 可根据参数个数不同或者参数类型不同区分 即构造函数的重载方法的重载重写重载重写区别this关键字在构造方法中指该构造器所创建的新对象也就是对应对象的属性也可以使用this关键字调出对象本身例如在一个对象的setAge中调用getAge注意:this只能在类的非静态方法中使用 静态方法与静态的代码块中不能出现this 原因 static方法在类加载时就已经存在了 但是对象在创建时才在内存中生成super关键字super关键字主要存在于子类方法中用于子类调用父类的方法例如子类重写了父类的一个方法 但是又想重新调用一次父类的方法就使用super关键字static关键字静态 的关键字静态变量静态方法静态代码块使用了static后的方法变成类方法 不需要new就能直接调用final关键字final修饰的类不能被继承final修饰的方法不能被重写 但是可以直接用final修饰的基本类型变量不可变 但是引用类型变量引用不可改变 但是引用对象的内容可以改变抽象类在class前加一个abstract来修饰抽象方法要在子类里进行实现 不然不正确接口将class替换为interface即可接口里所有定义的方法实际上都是抽象的public abstract变量只能为public static final类型的public abstract void add(); 等效于 void add();抽象类与接口的区别接口要被子类实现 抽象类要被子类继承接口中变量全为公共静态常量 抽象类中可有普通变量接口中全为方法的声明 抽象类中可以有方法的实现接口中不可以有构造函数 抽象类中可以有构造函数接口可多实现 而抽象类必须被单继承接口中方法全为抽象方法 而抽象类中可以有非抽象方法内存机制栈存放局部变量 不可以被多个线程共享系统自动分配空间连续 速度快堆存放对象 可以被多个线程共享每个对象都有锁空间不连续 速度慢 灵活方法区存放类的信息:代码 静态变量 字符串 常量等可以被多个线程共享空间不连续 速度慢 灵活垃圾回收机制程序员不能调用垃圾回收器 但是可以通过system.gc()建议回收未引用的会被回收finallize方法 每个对象都有这个方法 用来释放对象区域资源 一般不去调用递归算法递归头 什么时候不调用自己递归体 什么时候调用自己异常机制:try catch finally catch的顺序 先小后大声明抛出异常:throws手动抛出异常:throw自定义异常: 首先继承Exception 或者它的子类容器:Collection接口: List -》ArrayList LinkedList Vector Set-》HashSet 内部使用HashMap实现Map接口: 采用 key value存储数据 HashMap线程不安全 效率高 HashTable线程安全 效率低Iterator接口:遍历容器中元素泛型:Collections: 包含排序查找的工具类字符串比较中 == 与 equal的区别==:比较的是两个字符串内存地址(堆内存)的数值是否相等,属于数值比较;equals():比较的是两个字符串的内容,属于内容比较。多态多态体现为一个事物的多种形态 例如 父类引用变量可以指向子类对象isinstanceof 向上转型 将子类对象赋值给父类变量 向下转型 将父类对象赋值给子类变量注解也叫元数据 用于描述数据的数据基本注解:@Override 重写 在重写的方法前加入即可@SuppressWarnings 压制警告 在警告内容前加入 可以让我们暂时忽略特定的警告自定义注解[public] @interface 注解名 { 数据类型 成员变量名()[default 初始值] }注解跟类一样 会被编译为 注解名.class的字节码文件成员变量名后面的()必不可少反射机制一段程序在运行过程中 接受一个对象作为形参 该对象的编译时类型与运行时类型不一致 但是程序又需要调用该对象运行时的类中的方法这就需要引用反射机制 保证在程序运行过程中可以知道任意对象的运行时类型可以构造任意类的对象可以调用任意对象的属性和方法其实就是在运行时获取对象的属性与方法,例如对象.getClass内部类将一个类作为成员放在另一个类或者方法的内部嵌套类内部类可以分为 非静态内部类和静态内部类非静态内部类 是指 在非静态类的方法内访问某个变量时 先找局部变量 再找内部类的属性 最后找外部类的属性如果局部变量 内部类属性 外部类三者名字相同静态内部类是用static修饰的内部类都称为静态内部类静态内部类是一个普通类 可以包含静态成员 也可以包含非静态成员静态内部类不能访问外部类的实例成员 只能访问外部类的类成员lambda表达式当接口中只有一个抽象方法 匿名内部类的语法过于频繁这种接口叫做函数式接口表达式 : (形参列表)->{代码块}形参列表:如果形参列表中只有一个参数 形参列表的圆括号也可以忽略异常处理基本语法try{ 执行语句 }catch (ExceptionType e) { 异常处理 }finally{ 无论是否发生异常都会执行的语句 }创建Exception通过继承Exception来创建异常public class CustomException extends Exception{ public CustomException(String message){ super(message) } }throw/throws用于手动抛出异常 需要使用public void processAge(int age) { if (age < 0) { throw new IllegalArgumentException("Age cannot be negative"); } // 其他处理逻辑 }throwspublic String readFile(String fileName) throws IOException { // 读取文件内容的逻辑 }输入输出操作InputStreamInputStream是用于从各种源(如文件、网络连接等)读取字节流的抽象类。它定义了一系列用于读取字节的方法。你可以使用InputStream来读取二进制数据,比如图片、音频或视频文件。OutputStream是用于向各种目标(如文件、网络连接等)写入字节流的抽象类。它定义了一系列用于写入字节的方法。你可以使用OutputStream来写入二进制数据,比如将数据写入文件或通过网络发送。Reader是用于从各种源(如文件、网络连接等)读取字符流的抽象类。它定义了一系列用于读取字符的方法。你可以使用Reader来读取文本数据,比如读取文本文件中的内容。Writer是用于向各种目标(如文件、网络连接等)写入字符流的抽象类。它定义了一系列用于写入字符的方法。你可以使用Writer来写入文本数据,比如将数据写入文本文件。// 使用FileReader读取文件 FileReader fileReader = new FileReader("file.txt"); int data = fileReader.read(); // 读取一个字符 while (data != -1) { System.out.print((char)data); data = fileReader.read(); } fileReader.close(); // 使用FileWriter写入文件 FileWriter fileWriter = new FileWriter("file.txt"); fileWriter.write("Hello, world!"); fileWriter.close();System.in、System.out 和 System.errSystem.in、System.out和System.err是Java中的三个标准I/O流。System.in:标准输入流,通常对应于键盘输入。你可以使用它来从控制台读取用户的输入。System.out:标准输出流,通常对应于控制台输出。你可以使用它向控制台输出信息。System.err:标准错误流,也通常对应于控制台输出。与System.out不同的是,它主要用于输出错误信息。泛型java 中泛型标记符:E - Element (在集合中使用,因为集合中存放的是元素)T - Type(Java 类)K - Key(键)V - Value(值)N - Number(数值类型)? - 表示不确定的 java 类型Collection \<E>Collection 是 Java 集合框架中所有集合类的根接口。它代表了一组对象,这些对象通常称为元素。Collection 接口的主要特点包括:存储一组对象:Collection 是一个容器,可以存储多个对象,这些对象可以是任何类型,包括基本类型的封装类、自定义对象等。无序性:Collection 不保证元素的顺序,即它们不一定按照插入的顺序进行存储和访问。允许重复元素:Collection 允许存储重复的元素,即相同的对象可以被添加多次。常见实现类:Java 中常见的 Collection 实现类包括 List、Set 和 Queue 接口的各种实现类,如 ArrayList、LinkedList、HashSet 等。Map<K,V>Map 接口代表了一种映射关系,它将键映射到值。Map 中的键是唯一的,而值则可以重复。Map 接口的主要特点包括:键值对存储:Map 存储的是键值对,每个键都映射到一个值。通过键可以快速查找对应的值。键的唯一性:Map 中的键是唯一的,每个键最多只能与一个值关联。值的重复性:Map 中的值可以重复,即不同的键可以映射到相同的值。常见实现类:Java 中常见的 Map 实现类包括 HashMap、TreeMap、LinkedHashMap 等。
2024年06月02日
30 阅读
5 评论
0 点赞
1
2