一、基于率失真优化的递进UTCQ编码(论文文献综述)
付东辉[1](2020)在《基于人眼视觉系统特性的图像压缩算法及实现的关键技术研究》文中研究说明计算机和半导体技术的迅猛发展,引领着信息时代的跨越式前进。大数据信息时代,图像数据占据了相当大的比重,在追求高分辨率,高帧频的同时,也面临海量数据传输与存储的挑战。为此许多图像的编码标准相继被提出,其中视频编码联合组(JCT-VC)发布的高效视频编码标准(HEVC),无论在视频还是图像编码方面都有着优异的性能表现。考虑到人眼是大部分图像信息的最终接收端,而传统的编码标准并没有考虑人眼的视觉系统(HVS)特性,图像编码时会残留大量的视觉冗余信息,不能够充分发挥HEVC编码标准的最佳性能。因此,在图像编码时融入人眼的视觉特性具有理论研究意义和现实应用价值。选题研究的目标是在有限的存储空间和传输带宽的条件下获得感知质量最佳的编码图像,研究的重点是实现如何将HEVC编码标准和HVS特性结合在一起以获得最佳的图像编码表现。研究工作基于HVS特性模型(包括恰可察失真和感兴趣区域模型),定义了一种数学意义上的像素感知失真测度,以估测图像像素的感知失真。并将定义的像素感知失真评价方法移植到HEVC中代替默认的客观像素失真评价方法,创建HEVC编码标准和HVS特性的关联。HEVC编码标准和HVS特性的联合编码可以降低编码过程中图像的视觉冗余信息,获到更好的图像编码表现。为实现联合编码的目标,研究将图像编码的两个关键参数失真和码率作为切入点寻找相应的解决方法。一方面在图像感知失真相同的情况下,尽可能的减少图像的编码比特;另一方面在消耗相同编码比特数的情况下,尽可能的获得更好的图像感知质量。从HEVC图像编码理论的角度分析,对问题的理解可以概括为:解决不同条件下因引入感知失真而带来的率失真优化问题。基于率失真优化理论,可以进一步将问题的关键定位在率失真优化的决定因素拉格朗日乘子λ上。选题的研究工作就是基于HVS模型和感知拉格朗日乘子的关系开展的,主要的工作和创新点包括:关于指定量化参数的条件,针对恰可察失真模型,论文提出了两种获取感知拉格朗日乘子的方法:一种是通过研究分析考虑人类视觉系统特性时和不考虑人类视觉系统特性时编码参数的关联性,先建立和图像内容无关,和失真门限值相关的感知拉格朗日乘子系数的查找表。图像编码时,再根据建立的和图像内容相关的加权公式,计算出符合编码条件的感知拉格朗日乘子。另一种是添加预处理操作,通过预处理操作统计所需要的和图像内容相关的图像失真与比特数据,然后依据率失真优化理论计算出感知拉格朗日乘子的值。针对感兴趣区域模型,本文基于率失真理论,分析了如何在引用感兴趣区域模型时选择合适的感知拉格朗日乘子,并证明了使用默认拉格朗日乘子的可行性。关于约束码率的条件,论文根据基于率失真优化理论的传统λ域码率控制方法,提出了适用于图像感知编码的码率R、拉格朗日乘子λ、量化参数QP的R-λ-QP关系模型,提出的感知模型是对传统模型的一种拓展,将传统模型作为感知模型的一种特例。为了保证编码比特分配的准确性和合理性,也提出了一种基于编码树单元的比特分配方法,实现了根据像素显着值合理分配编码比特的目标。为检验提出方法的编码表现,将所有的算法都在HEVC的算法参考软件HM(HEVC test Model)上进行了编码实现。测试实验的结果表明,针对不同约束条件所提出的解决方法,对应的图像感知编码表现都得到了不同程度的提升,证明了提出方法的有效性和合理性。同时考虑图像感知编码的实际应用问题,利用硬件并行处理的速度优势,研究工作基于开源HEVC编码核和恰可察失真模型,在指定量化参数条件下实现了基于modelsim的功能仿真测试,验证了提出方法在工程上的可实现性。
鲁国[2](2020)在《视频压缩编码及其质量增强的优化技术研究》文中认为近年来,随着多媒体技术的蓬勃发展,视频作为重要的信息传递媒介,其应用需求和数量规模迎来了爆发式的增长。更为重要的是,消费者对高分辨率、高帧率的高品质视频需求也日益强烈,这对视频传输系统的压缩效率和质量增强提出了更高的要求。本文从视频编码系统整体优化的角度出发,围绕提高视频压缩效率和提升压缩视频质量这两个关键问题展开深入研究,创新性地提出了一个基于深度学习的完整视频压缩编码系统,从而显着提升了视频压缩效率。同时本文分别从视频编码预处理和解码后处理入手,结合视频编码特性,提出了内置帧率上变换的高效视频编码系统和压缩视频复原算法,从而提升了压缩视频的质量。本论文的研究工作针对整个编码系统,实现了高效率的视频压缩以及高品质的压缩视频重建,增强了终端的视频质量并减少了视频的传输带宽。本文的主要研究内容及创新归纳如下:围绕高帧率视频的产生与编码问题,本文提出了在编码器中内置视频帧率上变换,并与视频压缩编码联合优化的方案。为了在编码端产生高质量的高帧率重建视频,并且减少高帧率视频传输带来的带宽消耗,本文给出了一个视频压缩编码和帧率上变换的联合优化模型,从而能够根据率失真策略对帧率上变换进行优化。这种新架构的关键是把帧率上变换功能嵌入编码器环路中,并在原有的运动估计和运动补偿模块中增加帧率上变换功能。这种高帧率编码新架构有效地提升了高帧率视频编码的性能,并使得解码器能直接解出高帧率视频。本文给出的系统充分结合已有的编码多层次划分架构,给出一个多信息融合的运动估计策略;同时根据运动可靠度和量化误差,建立一个内插帧的失真模型。所提出的内嵌帧率上变换功能的联合优化编码系统,在保证压缩标准兼容的前提下,比传统预处理加编码的级联系统显着减少了高帧率视频的码率消耗,去除了编码端帧率上变换预处理和解码端帧率上变换后处理的需要,从而显着降低了编码端和解码端处理高帧率视频的计算复杂度。针对压缩视频图像的高质量后处理,本文对于压缩视频的失真复原问题提出了一个基于深度学习的卡尔曼递归模型。视频的有损压缩编码,意味着解码端的视频重建不可避免地存在压缩图像的失真现象。本文结合基于模型和基于学习这两种方法的优势,首次提出了一个应用于视频复原的基于深度学习的卡尔曼递归模型。所提出的算法将视频的压缩失真复原建模为一个卡尔曼滤波递推问题,通过利用卷积神经网络估计卡尔曼滤波器状态和计算卡尔曼增益,获取准确的后验估计。对于视频图像序列,本文提出的方法一方面利用了卡尔曼递归滤波特性,另一方面又发挥了深度学习的数据驱动的特长,从而实现压缩视频图像的高效复原。对于深度学习视频压缩这一关键问题,本文首次给出了一个端到端优化的完整视频压缩编码系统。本文系统充分利用当前视频压缩编码的混合编码框架和深度学习的强大表达能力,通过设计编码系统中的运动估计网络、运动信息压缩网络、运动补偿网络、残差压缩网络以及码率估计网络,实现了一个基于混合编码架构和深度学习的完整压缩编码系统。整个编码系统可以通过率失真损失函数进行端到端的整体优化,从而实现高性能的视频压缩。与此同时,本论文基于深度学习的视频压缩系统具有很强的可扩展性,从而能够根据速度和性能的需求进行对应设计。实验结果表明,相比较当前广泛使用的H.264算法,本文给出的深度视频压缩算法能够实现更高的压缩效率。即便与最新标准H.265相比,本文给出的视频编码系统能够实现相似甚至更好的主观质量。本论文围绕视频压缩编码及其质量增强的优化技术展开研究,所提出的系统和方法提升了视频压缩效率、增强了视频质量,为应对高品质视频需求提供了卓有成效的解决方案。更为重要的是,通过对深度卡尔曼模型、基于深度学习的视频压缩编码等研究方向的探索,为今后的研究提供了有益借鉴。
徐景行[3](2019)在《全景视频自适应传输技术研究与系统实现》文中研究表明随着虚拟现实技术的快速发展,人们对全景视频这类沉浸式媒体的需求不断增长,然而高分辨率全景视频具有很高的视频码率,给网络传输带来了很大挑战。传统的视频传输方案将视频完整地在网络上传输,而全景视频中用户可视区域只在视点范围内,视点外背景区域的视频内容对网络带宽资源造成了浪费。现有研究成果中,采用基于视点的自适应传输方案,对全景视频内容空间中各区域依据视点位置进行质量分级,按照质量等级采取相应的码率传输各视频区域。本文对基于空间分块(Tile)的全景视频传输进行了研究,提出基于视点的码率自适应算法,利用DASH(Dynamic Adaptive Streaming over HTTP)流媒体技术动态传输视频内容,并对传输系统做出架构设计与开发实现。全景视频的视点自适应传输通常使用空间分块(Tile)将完整画面划分多个子区域,为了衡量全景视频的传输质量,本文构建了视点自适应传输的QoE(Quality of Experience)模型。QoE模型包括评价视点画面质量的目标函数和用于码率控制的约束条件。质量评价方法根据设计的视点失真度和平滑度去衡量视频每个分块视频基于视点的画面质量及其稳定性,码率控制方法依据带宽估计和缓冲水位在传输过程中动态调整分块视频集合的上限码率。针对此QoE模型,本文进一步提出了一种基于边际效用优化的码率自适应算法,依据QoE边际效用的排序序列对分块视频逐个进行码率升级,为分块视频集合确定优化的码率选择方案,利用有限网络带宽加强视点QoE,提高用户体验。通过对比实验,验证了提出算法相对于传统方法性能提升巨大,相对于现有自适应方法也存在明显提升。目前关于全景视频自适应传输的研究多数基于系统仿真,不能反映现实环境中的效果,根据这种情况,本文对全景视频传输系统进行架构设计并开发实现。采用了主从式结构,客户端根据提出的QoE模型对每组分块视频集合计算基于视点的QoE边际效用,执行提出的码率自适应算法,根据码率决策结果自适应地获取多路分块视频流。传输过程中,客户端并行地下载视频分片,解码数据并渲染拼接成完整的全景视频画面,呈现在用户的头戴式显示器中,提供沉浸式视频体验。服务器管理维护多码率版本的分块视频片段和视频索引文件,并提供DASH流媒体服务。服务器端采用高性能异步服务器模型设计,利用线程池处理视频流传输过程中的流程事件,具有优秀的并发能力。系统性能测试结果表明,实现的全景视频传输系统,能够高效率得并行处理多路分块视频流,并根据视点实现码率自适应。
张哲为[4](2019)在《基于感兴趣区域率失真优化的视频压缩编码通信系统设计》文中研究说明基于感兴趣区域模式的视频压缩编码近年来成为视频压缩、计算机视觉领域研究的热点课题。从广义上来讲,视频中的感兴趣区域指视频帧中引起人们注意的像素部分区域。它通常包括视频中运动的目标、色彩变化的区域。感兴趣区域视频编码的关键思想在于,对这部分区域以较小的量化步长进行压缩编码,以获得较高的编码精度。而对于非感兴趣区域部分,则采用较大的量化步长进行粗糙编码,以降低整体编码输出的比特。依据人体视觉系统的要求,感兴趣区域视频编码的目的是将特定的感兴趣区域在解码端得以清晰的呈现,而对于非感兴趣区域,人们的关注点并不在这部分,因此并没有必要完全保证这部分的编码质量。换句话说,在某种特定应用场景下,为尽可能减小编码速率,仅保留感兴趣区域部分的编码精度以达到不影响人们对视频内容理解的目的。本文设计了一套基于感兴趣区域率失真优化的视频编码通信系统,该系统包括感兴趣区域提取模块、感兴趣区域视频编码率失真模块与感兴趣区域视频流传输模块。设计这套系统的目的在于实现低比特视频流通信同时不影响对视频内容的理解。围绕这一系统展开,本文主要研究这三大模块中的三个核心技术:感兴趣区域提取技术、感兴趣区域视频编码的率失真优化技术、感兴趣区域视频流在无线网络环境下的传输技术。其中,感兴趣区域提取技术主要研究如何从视频帧数据中提取感兴趣区域,它主要指运动的区域以及一些特定的目标物体。这一部分区域作为视频帧的前景部分,而其它区域则作为背景部分。感兴趣区域视频编码的率失真优化技术主要解决视频编码中的速率和失真权衡的问题。即给定一组视频序列,使得速率受限制的约束条件下,该组序列的失真达到最小。在解决这一优化问题时,如何建立恰当准确的速率失真模型是其中的关键部分。速率失真模型可对感兴趣区域编码模式下的速率、失真进行数学描述。通过速率失真模型列出率失真优化问题的目标函数以及约束条件,并对其进行求解,得到视频组序列每帧的比特分配方案,进而设计速率控制策略。感兴趣区域视频流传输技术主要以异构无线网络为背景,通过对视频帧中编码单元的编码信息进行封装,组成网络层的传输单元并将这些传输单元分配到不同属性的无线信道进行传输。异构无线网络的传输的模式仍基于端到端的传输模式,然而终端具有多家乡接入属性。通常上讲,终端具有多元化网络接入单元接口,可同时接入不同属性的无线网络。感兴趣区域编码模式下的视频流传输力图保证包含感兴趣区域信息的传输单元能够具有较少的传输失真与解码失真。同时,视频流的传输需满足实时性要求。对于超过时延截止部分的视频流分组则会被丢弃以节约网络资源。此外,传输过程中引入信道差错控制编码技术,通过引入额外监督位降低误码率,并尽可能满足感兴趣区域部分信息得以完整的解码与重建。本文针对上述内容,对感兴趣区域视频编码的关键技术进行了深入详细的研究,主要内容包括:(1)研究了感兴趣区域提取技术。结合传统的数字图像处理理论以及当前流行的深度学习理论。本文分别提出了两种新的感兴趣区域提取检测方法:级联模型算法与基于文本主题模型的边界框修正算法。其中,级联检测算法四个级联步骤:全局运动补偿,运动块提取,多层像素分割和模型更新。前面两个步骤提取前景运动块并形成运动遮罩,后面两个步骤移除属于运动遮罩内背景的像素,并更新背景模型的颜色分布。另外,提出了基于块到像素的检测思路以实现检测灵活性。所提出的方法的另一个好处是它可以嵌入视频编解码器中以进行实时ROI检测和编码。实验结果表明,该方法在检测精度和时间消耗方面都实现了改进的性能。文本主题模型的边界框修正算法属于机器学习算法。它包含两个阶段:模型训练与验证。在训练阶段,它将检测目标图像的特征点信息转换成文本信息。在文档主题生成模型(Latent Dirichlet Allocation,LDA)的基础上,本文提出了一个具有单词共现先验的主题模型,其中图像特征之间的共现信息被充分利用。在验证阶段,本文提出了一种基于边界框(Anchor-box)的修正算法,该算法可以从一些传统算法中快速检测与预训练主题模型相对应的检测结果,并具有快速检测时间。对各种数据集的实验表明,所提出的方法可以在效率和计算成本方面提高检测性能。它对于颜色,光照,尺度等不同的物体也具有鲁棒性。有趣的是,所提出的方法可以与许多快速但有失准确性的感兴趣区域提取算法相结合,并增强了系统模型的灵活性。(2)研究了感兴趣区域视频压缩的率失真优化与速率控制技术。本文提出了一种基于DCT残差系数的混合分布与径向基函数神经网络的适合感兴趣区域编码模式下的速率失真模型。通过将编码单元分类为不同的深度、纹理特征来对其速率失真进行建模。在此之后,利用所提出的速率失真模型,列出率失真优化问题的目标函数以及约束条件,并根据凸优化理论对其进行求解。同时,设计针对感兴趣区域编码模式下的速率控制策略。通过实验验证,所提出的方法在解码重构的视觉质量,速率失真性能和比特率精度等方面取得了相应的改进。它针对感兴趣区域部分取得了较高的编码精度,同时保持编码缓冲器稳定输出,失真满足在可控范围内。(3)研究了感兴趣区域编码模式下视频流在无线异构网络环境下的传输技术。本文提出了一种基于感兴趣编码模式视频传输框架,该框架基于多家乡接入终端的异构无线网络环境。它包含感兴趣区域提取模块和帧分离器的模块,其中编码单元被分类封装到网络传输单元中。该框架还包括监视每个通信路径状态的信道监视器,并将反馈信号发送至视频流控制器来进行分组调度控制。本文提出了用于信道状态预测的深度学习方法。为了解决视频流分组传输问题,本文设计了适用于感兴趣区域编码模式下的视频流传输的速率失真模型,并制定传输调度策略。该策略传输延迟和失真之间寻求平衡点。它还保证具有ROI内容的数据包在具有足够带宽和低损耗的路径上进行传输。通过与其他传输方法的比较的模拟实验,验证了所提出的方案在视频传输质量,端到端延迟以及播放流畅度方面均取得了良好的效果。
王宏宇[5](2019)在《视频编码结构与优化算法研究》文中研究表明随着互联网信息产业与文化娱乐产业的发展,人们对视频数据的清晰度的需求日益增加。在有限带宽的前提下,保持视频数据的高分辨率,高质量是视频编码标准的主要研究目标。视频编码中的帧间预测参考以及率失真优化技术是两项极为重要的技术,通过视频帧之间相关性的继承,结合率拉格朗日最优化理论,使视频编码质量与码率得到极好的平衡。现有的参考结构与优化参数采用经验训练参数,对多样化的视频信源不具备自适应性。固定的参数分配对参考帧间时域依赖未做充分考虑。经验性的优化参数在理论上不完备,无法进一步逼近最优值。本文针对视频编码参考结构与优化方法存在问题,结合卷积神经网络方法,从三个方面开展研究。1.针对低延迟编码结构缺乏自适应性的问题,提出自适应参考帧抉择算法。根据低延迟参考结构,统计编码比特依赖性,建立参考帧影响因子模型,计算参考帧辐射最远距离,为编码帧自适应分配合理参考集合,以提升编码性能。该算法与HEVC参考软件相比,最高编码性能提升达到0.93%。2.针对视频时域分层结构参数固定的问题,提出参考结构决定拉格朗日乘子算法。根据时域分层结构特性,构建分层参考强度模型,结合时域层级、参考强度、质量差异,建立分层拉格朗日乘子调节模型,为时域分层分配合理优化参数,获得编码性能增益。与AVS2标准参考软件相比,在多种编码结构下取得最大1.3%的编码性能提升。3.依据卷积神经网络方法,以感受野理论为基础,设计感受野下降卷积神经网络,对图像特征进行深层次、粗粒度与细粒度描述。迭代训练与优化网络结构,提升编码失真图像的客观质量。网络应用于超高分辨率图像,取得平均0.5dB的综合PSNR提升。通过上述研究,本论文工作提出的自适应参考方法与编码优化参数抉择策略,在当前的混合编码架构下进一步改善视频编码效率。与HEVC、AVS编码标准平台相比,对编码性能均有明显增益。本文提出感受野下降神经网络,对超高分辨率、多场景的图像集合,取得显着的客观质量提升。本文所提出的优化工具已被AVS2标准采纳应用,所提出的网络结构参与ChinaMM主办的深度学习图像滤波竞赛,并获得创意奖。
冷龙韬[6](2019)在《虚拟现实视频图像编码优化算法研究》文中认为随着多媒体技术的发展,一种名为虚拟现实的新技术应运而生,这种技术可以通过实时演算为用户提供沉浸式的虚拟世界仿真系统。虚拟现实的360°视频图像能够表示完整的球面信息,这些信息会以二维数据的形式存放在存储介质中,但从球面数据投影至二维数据时极易引入畸变以及像素冗余。因此,对于虚拟现实的360°视频序列,直接使用传统的二维编码器进行压缩编码难以获得令人满意的效果。如何设计畸变和像素冗余更少的投影方式,如何获得更好的重建图像质量是这个领域的研究重点。(1)分析了时域率失真优化的拉格朗日乘子失准现象,定义了帧级编码单元及其比特的计算方法,通过分析时域临近编码帧的比特热度图分布来反馈调节当前编码帧中所有编码单元的拉格朗日乘子,使得编码单元的拉格朗日乘子逼近最优拉格朗日乘子,优化编码单元的比特分配,提升编码效率。(2)分析了经纬图中纬度与有效像素的关系,建立了纬度决定比特分配的算法模型。该算法能够针对经纬图中编码单元所处位置的有效信息为编码单元分配合理的目标比特,该算法能够为经纬图的编码带来显着的编码性能提升。(3)深入研究了PID控制理论,结合PID控制器与本文提出的两种编码优化算法,提出了一种基于PID的VR码率控制模型,该模型通过PID控制器保证码率控制过程的稳定,在利用编码优化算法为每一个编码单元分配合理的目标比特数。大量实验表明,该码率控制算法能够满足不同应用场景的需求,具有良好的编码性能和控制精度。通过上述的研究,本论文提出的基于比特热度图的比特重分配算法能够根据已编码比特反馈调节当前编码单元的编码参数,测试表明算法在低延时编码配置下取得一定编码性能增益。本文提出的基于PID的VR码率控制模型能够精确控制编码的输出码率,同时获得可观的编码性能提升。本文提出的最大编码单元级拉格朗日乘子优化方法能够针对编码单元的有效像素进行比特分配,在HEVC编码标准平台相比,取得了显着的编码性能提升。同时,最大编码单元级拉格朗日乘子优化方法已被AVS2标准采纳至参考软件。
乔莉[7](2018)在《基于DSP的高清视频编码实时传输关键技术研究》文中研究指明信息化时代,新一代以高清(HD)、超高清(UHD)等为代表的视频在给我们带来高清视频享受的同时由于海量数据信息,产生画面延迟、卡顿等问题。需要有更高效的视频压缩、更快的带宽来实现视频实时传输、高清显示和便捷存储。由于带宽提升的局限性,在有限带宽的信道中传输海量的视频,只能通过视频压缩的方法。本文主要研究高清视频编码实时传输关键技术——如何通过视频编码的软件压缩算法,实现高清视频的实时传输。将传统的标清视频清晰度提高到高清视频的同时,还需要提高传输的实时性,使得视频流畅,不卡顿,满足广大用户的视觉体验。目前,嵌入式系统在视频处理中得到了广泛的应用,实现了多媒体视频的采集、压缩、网络传输与解压缩、显示等。DSP成为首选,可以快速处理运算量几百甚至几千MIPS(Million Instrutions Per Second)的视频编码,为高清视频高质量传输系统提供了硬件平台。在平台构建中,首先对混合编码的框架及其中的关键技术进行了研究,同时分别研究了H.264/AVC和H.265/HEVC,两代视频编码标准的框架、基本原理及关键技术,之后对高清视频编码实时传输系统选用高清摄像头套装进行视频采集,利用TMS320DM6467T核心硬件测试平台采用H.264/AVC视频编码标准进行视频编码实现压缩,利用TMS320C6678核心硬件测试平台采用H.265/HEVC视频编码标准进行视频编码实现压缩,以VSC8641核心芯片构建了传输信道实现千兆网实时传输等。对高清视频实时传输系统进行了设计、实验、分析和对比。结果显示:高清视频实时传输系统在不同分辨率和帧率下的视频压缩比和质量不同,使用H.265/HEVC视频编码标准的系统比使用H.264/AVC压缩比提高了一倍,(H.264/AVC压缩比为150倍),质量更为清晰。为其合理利用提供了技术与理论支持。
冯阳,王春桃[8](2017)在《基于统计模型进行率失真优化的加密图像压缩算法》文中研究表明如何对加密数据进行有效压缩和高质量重构是云计算环境中颇具挑战性的一个研究问题。其挑战性主要来自于云用户的加密操作掩盖了载体数据的统计特性,从而使得云端的压缩很难像常规压缩那样充分利用载体的统计特性。在小波系数统计模型吻合度评估的基础上,提出了一种基于统计模型进行率失真优化的加密图像压缩算法。将灰度图像经提升小波分解后的低频子带和小波子带分别进行流密码加密和置乱加密,然后再分别进行无损和有损压缩,最后进行相应的逆操作而重构原图像。鉴于充分的评估实验表明柯西分布能更良地表征图像小波系数,因此利用柯西分布来表征小波系数,并在此基础上利用率失真理论推导有损压缩用的最优量化步长。实验仿真结果表明,所提出的加密图像压缩算法能获得良好的压缩效率和重构质量,且能显着优于同类经典算法,并与常规的JPEG压缩算法性能相当甚至更好。
徐梦莹[9](2016)在《AVS2视频编码的语法元素分析及率失真技术中的码率估计算法》文中研究说明在现在社会中,多媒体信息逐渐成为信息传输过程中的主体,其快速发展和日渐提高的用户需求使得视频压缩技术不断的更新和改进。在国外出现了上一代视频编解码标准H.264/AVC和新一代视频编解码标准H.265/HEVC的情况下,我国也大力研发具有自主知识产权的视频编解码标准,相继推出了《信息技术先进音视频编码》(AVS)和《广播电视先进音视频编解码第1部分:视频》(AVS+)。2013年开始,我国开始自主研发新一代的视频编码标准——AVS2,目前正在执行过程之中。AVS2视频编码的语法元素是实现熵编码及解读码流结构的基础。由于AVS2参考代码RD7.0-RD11.0(2014年6月-2015年7月)附带的关于语法元素的文档资料不完备且与实际代码存在很多不一致,论文以RD11.0的实际代码为基础,详细分析了all-intra配置条件下的全部语法元素和码流结构并给出了分析报告,对于研究和改进AVS2视频编码算法具有重要参考价值。论文对AVS2视频编码模式选择中的率失真优化技术进行了研究,发现为了在众多候选模式中通过计算其最小代价来选择出最佳的候选模式过程中需要反复计算码率,而码率的计算必须通过执行熵编码来实现。因熵编码重复调用次数巨大,故耗时很多。论文提出了一种码率近似估计算法来代替最佳预测模式选择过程中的熵编码码率计算。该方法通过统计二值化的待编码符号中的最大概率和最小概率来计算估计码率的近似值而非通过熵编码的实际计算来获得真实的码率。针对多种YUV视频集,在RD11.0编码器上进行的编码试验结果表明,率失真优化选择码率计算的过程时间平均减少69.49%,总的视频编码时间平均减少10.99%,而码率增加不超过1.5%,PSNR与标准代码基本无差别。本文分为4章:第一章:主要介绍了视频编码的研究背景和发展现状,以及国内外的相关研究现状与比较,针对提高了压缩效率但却大幅度提高了编码时间复杂度这一问题,对本文的研究方向的阐述。第二章:介绍了AVS2视频编码的编码框架,帧内&帧间预测技术、变换量化、熵编码技术,并对率失真优化技术做了阐述。第三章:对AVS2中的码率结构和其语法元素做了分析。第四章:针对模式选择中的率失真优化技术,给出了码率估计替代熵编码计算码率的算法,并给出了实验结果及分析。
王洪涛[10](2015)在《面向视频编码标准应用的帧间预测技术研究》文中研究表明在计算机技术以及网络通信技术,特别是移动计算和移动通信技术飞速发展的背景下,视频应用正在以前所未有的速度迅猛增长。同时,视频应用中网络和终端多样化的特点也呈现地愈发明显。网络视频点播、高清电视直播、视频电话、视频会议、视频监控等基于视频的应用形式正在广泛而深远地影响着人们的工作和生活。作为视频技术能够得到广泛应用的一个必要条件,视频编码的标准化已经经历了数十年的发展历程,产生了一系列的视频编码标准。从早期的H.261、H.262/MPEG-2、H.263等等到目前主流的H.264/AVC,以及最新的HEVC等。每一代视频编码标准都提供了一系列的编码工具,视频应用开发者可以自由地利用编码标准所提供的编码工具产生符合标准的码流,而编码标准对于编码工具的定义也在很大程度上决定了采用该编码标准所能达到的编码性能。目前主流的视频编码标准均采用了基于预测、变换、量化、熵编码的混合编码框架。其中,帧间预测是编码器挖掘视频信号的时间相关性的主要手段。帧间预测技术对视频应用有两个方面的影响:首先,帧间预测的效率对编码的整体效率有很大的影响,帧间预测的效率涉及预测信号的精度和预测信号所需的运动信息开销两个方面,预测信号越精确、运动信息开销越小,则预测的效率越高;其次,帧间预测导致帧与帧之间的数据依赖,这种依赖制约了码流的适配能力,而视频编码标准中对码流适配的支持(如实现随机接入、码流的时间可伸缩等)通常对应着某种程度上对参考关系的切断。在标准和应用层面需要合理地定义和配置编码的参考关系,以达到编码效率和码流适配能力的平衡。本文面向当前主流的视频编码标准,以帧间预测技术为主要研究内容,从预测信息的编码效率和码流适配能力两个方面对现有的帧间预测编码方法进行了研究。一方面针对基于运动矢量竞争的运动信息编码方法进行了改进,降低了码流中描述预测信号所需的数据开销,进而提升了帧间的整体编码效率;另一方面深入研究了感兴趣区域可伸缩编码场景下的帧间预测数据依赖问题,在标准兼容的基础上提供了感兴趣区域可伸缩及可重写的高效编码方法。本文的主要工作及创新点如下:1.面向基于运动矢量竞争的运动信息编码技术,提出了基于区域划分准则的运动矢量编码方法。该方法使用基于欧氏距离的区域划分准则进行运动矢量预测选择,以便对运动搜索的备选搜索点集合按照区域划分的方式进行分类处理。对属于特定类别的运动矢量在解码通过直接推导的方式获得编码端的竞争矢量选择信息;而对其他分类的运动矢量,利用数据隐藏的方法将竞争矢量的选择隐藏在运动矢量残差的奇偶性当中,通过在KTA及TMuC参考软件平台进行实验仿真,证明了该方法在编码效率上显着优于传统的竞争矢量编码方法。2.面向H.264/SVC的可重写SVC编码技术,提出了空间及感兴趣区域可重写的SVC编码方法。感兴趣区域可重写及空间增强层的可重写特性对提升H.264/SVC码流向H.264/AVC用户提供兼容服务的能力有重要意义。针对H.264/SVC不支持空间可重写的缺点,本文方法利用变换域的帧间残差上采样技术克服了空间增强层层问残差预测计算量大的问题,实现了空间增强层可重写编码。同时,针对H.264/SVC中感兴趣区域编码场景下感兴趣区域边缘非整像素对背景区域数据依赖的问题,本文采用了基于率失真优化准则的解决方法,在支持感兴趣区域可重写特性的前提下,取得了标准兼容性、压缩效率、以及解码漂移这三者之间的良好平衡,同时,针对仍然存在的解码漂移,利用关键帧技术控制可能产生的错误传播,进一步提高了总体编码效率。通过在JSVM参考软件平台进行实验仿真,证明该方法在保留感兴趣区域可重写特性的同时显着提升了编码效率。3.面向H.264/SVC增强层感兴趣区域编码,提出了基于辅助编码环路的SVC增强层感兴趣区域编码方法。该方法在增强层感兴趣区域进行单独解码时,利用基本层信息生成背景区域的近似信号用作参考,并在编码端维护了与感兴趣区域单独解码场景相对应的辅助编码环路。在该编码环路中,利用基本层信息,通过错误隐藏的方法生成参考信号(虚拟参考帧)的背景区域,而感兴趣区域则以虚拟参考帧为参考进行重建。编码的模式选择过程综合考虑两种解码场景下的率失真代价进行。在增强层完整解码时,解码环路与编码端的主编码环路相同步,而感兴趣区域单独解码时解码环路与辅助编码环路相同步。由上述过程生成的码流与H.264/SVC标准兼容,在支持感兴趣区域可伸缩编码的同时保证了编码效率、避免了错误传播的影响。论文在JSVM平台上与现有方法进行了对比仿真,实验结果表明该方法在感兴趣区域可伸缩的场景得到了优于现有方法的编码性能。
二、基于率失真优化的递进UTCQ编码(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于率失真优化的递进UTCQ编码(论文提纲范文)
(1)基于人眼视觉系统特性的图像压缩算法及实现的关键技术研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 课题研究背景及意义 |
1.2 相关工作的研究现状 |
1.2.1 恰可察失真在图像编码中的研究现状 |
1.2.2 感兴趣区域在图像编码中的研究现状 |
1.2.3 恰可察失真和感兴趣区域同时在图像编码中的研究现状 |
1.3 论文的主要工作和章节安排 |
第2章 HEVC编码和人眼视觉特性 |
2.1 HEVC编码标准 |
2.1.1 HEVC编码框架 |
2.1.2 相关的编码技术 |
2.2 人眼视觉系统特性 |
2.2.1 视网膜的成像与处理机制 |
2.2.2 视觉系统的感知特性 |
2.3 感知模型 |
2.3.1 恰可察失真模型 |
2.3.2 感兴趣区域模型 |
2.4 本章小结 |
第3章 基于感知模型的拉格朗日乘子获取方法 |
3.1 图像质量的评价方法 |
3.1.1 客观的评价方法 |
3.1.2 主观的评价方法 |
3.1.3 客观的感知失真评价方法 |
3.2 感知拉格朗日乘子的必要性 |
3.2.1 客观与感知失真的数值差异 |
3.2.2 具体感知模型的必要性 |
3.3 获取感知拉格朗日乘子的方法 |
3.3.1 查找表方法 |
3.3.2 预处理方法 |
3.4 基于硬件语言的实现 |
3.4.1 FPGA的速度优势 |
3.4.2 H.265 IP core的帧内编码技术 |
3.4.3 基于硬件语言λ的确定 |
3.4.4 感知编码器的设计 |
3.5 实验结果及分析 |
3.5.1 查找表信息 |
3.5.2 基于JND模型的图像编码表现 |
3.5.3 基于ROI模型的图像编码表现 |
3.5.4 基于JND+ROI模型的图像编码表现 |
3.5.5 基于硬件语言的图像感知编码表现 |
3.6 本章小结 |
第4章 基于感知模型的码率控制 |
4.1 传统的量化参数确定方法 |
4.1.1 基于客观评价的R-Q模型 |
4.1.2 基于客观评价的R-ρ-QP模型 |
4.1.3 基于客观评价的R-λ-QP模型 |
4.2 基于感知修正的量化参数确定方法 |
4.2.1 基于感知评价的R-λ推导方法 |
4.2.2 基于感知评价的λ-QP关系 |
4.3 比特分配方法 |
4.3.1 传统的比特分配方法 |
4.3.2 基于感知模型的比特分配方法 |
4.4 实验结果及分析 |
4.4.1 率失真性能表现 |
4.4.2 MOS评分表现 |
4.4.3 实际编码表现 |
4.4.4 比特分配准确性表现 |
4.5 本章小结 |
第5章 总结与展望 |
5.1 总结 |
5.2 未来展望 |
参考文献 |
附录 |
致谢 |
作者简历及攻读学位期间发表的学术论文与研究成果 |
(2)视频压缩编码及其质量增强的优化技术研究(论文提纲范文)
摘要 |
ABSTRACT |
主要符号对照表 |
第一章 绪论 |
1.1 研究背景及其意义 |
1.2 国内外研究现状 |
1.2.1 传统视频压缩编码 |
1.2.2 视频帧率上变换 |
1.2.3 视频压缩失真复原 |
1.2.4 基于深度学习的视频压缩 |
1.2.5 研究现状总结与分析 |
1.3 论文主要工作及结构安排 |
1.3.1 论文的主要研究工作 |
1.3.2 论文结构安排 |
第二章 理论基础 |
2.1 视频压缩编码 |
2.2 基于运动补偿的帧率上变换 |
2.3 卡尔曼滤波器 |
2.4 图像压缩的基础神经网络架构 |
第三章 视频压缩编码和帧率上变换的联合优化 |
3.1 引言 |
3.2 帧率上变换和视频压缩的联合优化框架 |
3.2.1 帧率上变换和HEVC算法的融合模型 |
3.3 联合运动估计算法 |
3.3.1 数据项 |
3.3.2 特征匹配项 |
3.3.3 平滑项 |
3.4 面向内插帧的率失真优化模型 |
3.4.1 内插帧的失真模型 |
3.4.2 预测误差的方差估计 |
3.5 实验结果与分析 |
3.5.1 实验条件设定 |
3.5.2 客观质量评估 |
3.5.3 主观质量评估 |
3.5.4 RDO准则的有效性验证 |
3.5.5 联合运动估计算法的有效性验证 |
3.5.6 融合模型的计算复杂度分析 |
3.5.7 与基于后处理算法的性能比较 |
3.6 本章小结 |
第四章 基于深度卡尔曼模型的压缩视频复原 |
4.1 引言 |
4.2 相关研究工作 |
4.2.1 单帧图像的压缩失真复原 |
4.2.2 基于深度学习的视频失真复原 |
4.2.3 基于非局部先验信息的图像复原 |
4.3 面向压缩视频失真复原的深度卡尔曼模型 |
4.3.1 卡尔曼滤波器的基础模型 |
4.3.2 基于预测量化误差先验的深度卡尔曼模型 |
4.3.3 基于非局部先验信息的深度卡尔曼模型 |
4.4 实验结果与分析 |
4.4.1 训练数据集 |
4.4.2 与业界领先算法的比较 |
4.4.3 消融实验分析 |
4.5 本章小节 |
第五章 端到端优化的深度视频编码系统 |
5.1 引言 |
5.2 相关工作 |
5.2.1 传统的图像和视频压缩算法 |
5.2.2 基于深度学习的图像和视频压缩算法 |
5.2.3 运动估计算法 |
5.3 端到端优化的深度视频压缩系统 |
5.3.1 深度视频压缩模型框架 |
5.4 深度视频压缩的网络设计 |
5.4.1 运动估计 |
5.4.2 运动编码与解码网络 |
5.4.3 运动补偿网络 |
5.4.4 残差编码和解码网络 |
5.5 网络训练策略 |
5.5.1 损失函数 |
5.5.2 量化 |
5.5.3 码率估计 |
5.5.4 参考帧缓冲设置 |
5.6 深度视频压缩框架的扩展 |
5.6.1 轻量级的深度视频压缩方案 |
5.6.2 增强版的深度视频压缩方案 |
5.7 实验结果和分析 |
5.7.1 实验设置 |
5.7.2 实验结果分析 |
5.7.3 消融实验分析 |
5.7.4 计算复杂度分析 |
5.7.5 深度视频压缩模型的分析与讨论 |
5.8 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读博士学位期间的科研成果及参与项目 |
简历 |
(3)全景视频自适应传输技术研究与系统实现(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 研究现状 |
1.3 研究内容 |
1.4 章节安排 |
第二章 全景视频背景技术综述 |
2.1 全景视频技术原理 |
2.1.1 应用架构总览 |
2.1.2 视频拼接与映射 |
2.1.3 编解码技术 |
2.1.4 自适应传输技术 |
2.2 DASH流媒体技术 |
2.2.1 DASH标准概述 |
2.2.2 DASH系统框架 |
2.2.3 DASH媒体表示描述 |
2.2.4 DASH媒体片段格式 |
2.3 本章小结 |
第三章 全景视频传输技术研究 |
3.1 引言 |
3.2 现有自适应传输技术研究 |
3.2.1 基于概率模型的视点自适应传输 |
3.2.2 基于率失真优化的视点自适应传输 |
3.2.3 基于调度序列的视点自适应传输 |
3.3 基于边际效用优化的视点自适应传输 |
3.3.1 码率控制方法 |
3.3.2 质量评价方法 |
3.3.3 算法描述分析 |
3.3.4 算法实验验证 |
3.4 本章小结 |
第四章 全景视频传输系统设计与实现 |
4.1 引言 |
4.2 系统总体架构 |
4.3 客户端设计与实现方案 |
4.3.1 网络服务模块 |
4.3.2 视频解码模块 |
4.3.3 自适应模块 |
4.3.4 渲染播放组件 |
4.4 服务器端设计与实现方案 |
4.4.1 流媒体内容准备 |
4.4.2 流媒体服务 |
4.5 系统性能测试 |
4.5.1 系统环境配置 |
4.5.2 测试样本及参数设定 |
4.5.3 性能测试结果分析 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
(4)基于感兴趣区域率失真优化的视频压缩编码通信系统设计(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 引言 |
1.2 感兴趣区域视频压缩编码概述 |
1.3 研究背景与意义 |
1.3.1 研究中的关键问题与挑战 |
1.3.2 相关背景概念介绍 |
1.4 论文主要研究内容与创新点 |
1.4.1 论文主要研究内容 |
1.4.2 论文主要贡献与创新点 |
1.5 论文的章节安排 |
2 基础理论与研究现状 |
2.1 引言 |
2.2 感兴趣区域提取技术的基础理论与研究现状 |
2.3 ROI编码模式下率失真优化技术的基础理论与研究现状 |
2.4 感兴趣区域视频流无线网络传输技术的基础理论与研究现状 |
2.5 本章小结 |
3 感兴趣区域提取技术研究 |
3.1 引言 |
3.2 级联检测模型算法 |
3.2.1 检测框架 |
3.2.2 检测算法 |
3.3 基于文本主题模型的边界修正算法 |
3.3.1 模型 |
3.3.2 检测算法 |
3.4 实验与性能分析 |
3.4.1 级联检测算法实验与性能分析 |
3.4.2 文本主题模型边界修正算法实验与性能分析 |
3.5 本章小结 |
4 ROI编码模式下的率失真优化技术研究 |
4.1 引言 |
4.2 ROI编码模式下的速率失真模型 |
4.2.1 速率模型 |
4.2.2 失真模型 |
4.2.3 率失真优化问题 |
4.3 ROI编码模式下的速率控制策略 |
4.3.1 GOP层速率控制 |
4.3.2 Frame层速率控制 |
4.3.3 CU层速率控制 |
4.4 实验分析 |
4.4.1 实验准备 |
4.4.2 编码质量比较 |
4.4.3 编码速率-失真性能比较 |
4.4.4 缓冲充盈度分析 |
4.4.5 速率控制的准确度与编码时间分析 |
4.5 本章小结 |
5 感兴趣区域视频流无线网络传输技术研究 |
5.1 引言 |
5.2 系统模型 |
5.2.1 传输系统框架 |
5.2.2 视频传输的速率失真模型 |
5.2.3 无线接入网络模型 |
5.3 传输优化问题与分组调度策略 |
5.4 实验分析 |
5.3.1 实验准备 |
5.3.2 传输质量评估 |
5.3.3 传输时延分析 |
5.3.4 传输路径的信道状态分析 |
5.5 本章小节 |
6 总结与展望 |
6.1 论文的研究总结 |
6.2 下一步研究工作展望 |
参考文献 |
作者简历及攻读博士学位期间取得的研究成果 |
学位论文数据集 |
(5)视频编码结构与优化算法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 研究现状 |
1.2.1 视频编码标准 |
1.2.2 视频编码帧间预测与参考结构 |
1.2.3 率失真优化理论 |
1.2.4 神经网络与图像压缩 |
1.3 主要研究内容 |
1.3.1 研究内容 |
1.3.2 章节安排 |
第二章 相关技术介绍 |
2.1 视频编码技术 |
2.1.1 图像与视频压缩 |
2.1.2 质量与性能评价 |
2.1.3 视频编码框架 |
2.1.4 视频编码基本技术 |
2.1.4.1 编码单元划分 |
2.1.4.2 帧内预测 |
2.1.4.3 帧间预测 |
2.1.4.4 变换与量化 |
2.1.4.5 图像滤波 |
2.1.4.6 熵编码 |
2.1.4.7 反馈控制 |
2.1.5 率失真优化理论 |
2.1.5.1 率失真函数 |
2.1.5.2 率失真优化方法 |
2.1.5.3 拉格朗日乘子 |
2.2 卷积神经网络 |
2.3 小结 |
第三章 低延迟自适应参考结构 |
3.1 视频编码参考结构 |
3.2 低延迟自适应参考结构 |
3.2.1 编码参考规则 |
3.2.2 参考帧影响力 |
3.2.3 参考集合设置 |
3.2.4 量化参数调节 |
3.3 算法流程 |
3.4 测试与分析 |
3.5 小结 |
第四章 基于参考结构的优化参数调节 |
4.1 时域分层参考结构 |
4.2 拉格朗日乘子 |
4.2.1 率失真优化的应用 |
4.2.2 率失真函数与拉格朗日乘子 |
4.3 参考结构决定拉格朗日乘子 |
4.3.1 帧间参考强度统计 |
4.3.2 拉格朗日乘子抉择 |
4.3.3 量化参数调节 |
4.4 算法流程 |
4.5 测试与分析 |
4.6 小结 |
第五章 基于卷积神经网络的图像质量优化 |
5.1 卷积神经网络与图像质量增强 |
5.2 感受野下降卷积神经网络 |
5.2.1 网络结构 |
5.2.2 网络训练 |
5.3 测试与分析 |
5.4 小结 |
第六章 总结与展望 |
6.1 全文工作总结 |
6.2 后续工作展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的研究成果 |
(6)虚拟现实视频图像编码优化算法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 引言 |
1.2 视频编码框架 |
1.3 虚拟现实视频编码研究现状 |
1.3.1 虚拟现实视频投影 |
1.3.2 虚拟现实视频的编码优化与控制算法 |
1.4 主要研究内容 |
1.5 论文的组织结构 |
第二章 理论基础 |
2.1 率失真优化简介 |
2.1.1 率失真理论 |
2.1.2 率失真优化基础 |
2.1.3 率失真优化模型 |
2.1.3.1 二次模型 |
2.1.3.2 ρ-域模型 |
2.1.3.3 指数模型 |
2.1.3.4 R-λ模型 |
2.2 码率控制算法研究 |
2.2.1 码率控制分类 |
2.2.2 H.264/AVC码率控制模型 |
2.2.2.1 GOP级码率控制 |
2.2.2.2 帧级码率控制 |
2.2.2.3 宏块级码率控制 |
2.2.2.4 总结 |
2.2.3 HEVC/H.265码率控制模型 |
2.2.3.1 R-λ模型 |
2.2.3.2 各层级码率分配机制 |
2.2.3.3 总结 |
2.2.4 AVS2玛率控制模型 |
2.2.4.1 模糊控制原理 |
2.2.4.2 控制流程 |
2.2.4.3 总结 |
2.3 小结 |
第三章 基于比特热度图的比特重分配算法 |
3.1 时域率失真优化λ失准问题 |
3.2 最优拉格朗日乘子推导 |
3.3 最优拉格朗日乘子估计 |
3.3.1 构建帧级编码单元 |
3.3.2 时域临近近似 |
3.3.3 最优拉格朗日乘子估计值计算 |
3.4 实施流程 |
3.5 测试与分析 |
3.6 小结 |
第四章 最大编码单元级拉格朗日乘子优化方法 |
4.1 视频客观质量评价 |
4.2 视频编码单元级优化 |
4.2.1 有效像素比分析 |
4.2.2 λ-θ模型 |
4.3 拉格朗日乘子的修正 |
4.4 算法流程 |
4.5 测试与分析 |
4.5.1 测试序列及测试条件 |
4.5.2 编码性能测试结果 |
4.6 小结 |
第五章 基于PID的VR码率控制算法 |
5.1 PID控制原理 |
5.2 PID码率控制系统 |
5.2.1 PID控制器解析 |
5.2.2 缓冲区码率偏差计算 |
5.2.3 目标比特率更新 |
5.2.4 编码参数调整 |
5.3 码率分配 |
5.4 算法流程 |
5.5 分析与测试 |
5.5.1 测试序列及测试条件 |
5.5.2 编码测试结果 |
5.6 小结 |
第六章 总结与展望 |
6.1 全文工作总结 |
6.2 后续工作展望 |
致谢 |
参考文献 |
个人简历及攻读硕士学位期间取得的研究成果 |
(7)基于DSP的高清视频编码实时传输关键技术研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 课题研究的背景和意义 |
1.2 国内外研究现状 |
1.2.1 视频压缩技术 |
1.2.2 视频编码标准 |
1.3 课题主要工作 |
1.4 章节安排 |
2 高清视频编码实时传输系统总体设计 |
2.1 高清视频编码实时传输系统的工作原理与结构 |
2.2 高清视频编码实时传输系统的硬件基础 |
2.2.1 TI的DSP芯片 |
2.2.2 网络传输 |
2.3 高清视频编码实时传输系统的软件基础 |
2.3.1 混合编码框架 |
2.3.2 混合编码关键技术 |
2.3.3 率失真优化和码率控制 |
2.4 高清视频编码实时传输系统评价 |
2.4.1 视频质量 |
2.4.2 压缩比 |
2.5 本章小结 |
3 高清视频H.264/AVC编码实时传输系统 |
3.1 H.264/AVC视频编码标准 |
3.1.1 H.264/AVC视频编码标准的结构 |
3.1.2 H.264/AVC编解码器的框架和结构 |
3.1.3 H.264/AVC标准关键技术 |
3.2 高清视频H.264/AVC编码实时传输系统硬件基础 |
3.2.1 高清视频H.264/AVC编码实时传输系统视频采集 |
3.2.2 高清视频H.264/AVC编码实时传输系统视频处理 |
3.2.3 高清视频H.264/AVC编码实时传输系统网络传输和上位机显示 |
3.3 H.264/AVCDSP算法移植 |
3.4 本章小结 |
4 高清视频H.265/HEVC编码实时传输系统 |
4.1 H.265/HEVC高效视频编码标准 |
4.1.1 H.265/HEVC视频编码标准的结构 |
4.1.2 H.265/HEVC编解码器的框架和结构 |
4.1.3 H.265/HEVC标准关键技术 |
4.2 高清视频H.265/HEVC编码实时传输系统硬件基础 |
4.3 H.265/HEVCDSP移植 |
4.4 本章小结 |
5 高清视频编码实时传输系统测试与实验 |
5.1 高清视频H.264/AVC编码实时传输系统测试与实验 |
5.1.1 客观评价 |
5.1.2 主观评价 |
5.2 高清视频H.265/HEVC编码实时传输系统测试与实验 |
5.2.1 客观评价 |
5.2.2 主观评价 |
5.3 高清视频编码实时传输系统应用对比 |
5.3.1 高清视频编码实时传输系统中视频编码标准对比 |
5.3.2 高清视频编码实时传输系统实验分析 |
5.4 本章小结 |
6 总结与展望 |
6.1 工作总结 |
6.2 工作展望 |
参考文献 |
攻读硕士期间发表的论文及所取得的研究成果 |
致谢 |
(8)基于统计模型进行率失真优化的加密图像压缩算法(论文提纲范文)
1 柯西分布及其参数估计方法 |
2 本文算法 |
2.1 加密过程 |
2.2 压缩过程 |
2.3 重构过程 |
2.4 量化步长最优化 |
3 实验结果 |
4 总结 |
(9)AVS2视频编码的语法元素分析及率失真技术中的码率估计算法(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 视频标准的国内外研究现状 |
1.3 论文主要工作和内容安排 |
第二章 《信息技术先进音视频编码》系列标准简介 |
2.1 视频编解码主要技术 |
2.1.1 帧内预测 |
2.1.2 变换量化 |
2.1.3 熵编码基本原理 |
2.2 AVS简介 |
2.3 AVS2的基本概念及编码框架 |
2.3.1 AVS2的基本概念 |
2.3.2 AVS2的编码框架 |
2.4 AVS2率失真优化技术 |
2.5 小结 |
第三章 AVS2标准中的语法元素分析 |
3.1 AVS2的码流结构分析 |
3.2 AVS2码流中的各层次的语法元素信息分析 |
3.2.1 序列头中待记录的语法信息 |
3.2.2 帧头待记录的语法信息 |
3.2.3 条带&最大编码块头待记录的语法信息 |
3.2.4 系数块待记录的语法信息 |
3.3 本章小结 |
第四章 AVS2模式选择中变换系数码率估计算法 |
4.1 AVS2中熵编码的实现方案 |
4.1.1 语法元素二值化 |
4.1.2 上下文模型的初始化及更新 |
4.1.3 算术编码 |
4.2 一种新的码率近似估计的模型 |
4.2.1 AVS2中熵编码码流输出原理 |
4.2.2 码率近似估计的模型 |
4.3 针对AVS2中变换量化系数的码率近似估计算法 |
4.3.1 变换块信息的码率估计 |
4.3.2 系数群内信息的码率估计 |
4.4 基于RD 11.0的算法实现及其分析 |
4.5 本章小结 |
总结与展望 |
致谢 |
参考文献 |
攻读硕士期间发表的论文及科研成果 |
附录 |
(10)面向视频编码标准应用的帧间预测技术研究(论文提纲范文)
摘要 |
ABSTRACT |
目录 |
第一章 绪论 |
1.1 引言 |
1.2 视频应用中帧间预测技术需要解决的问题 |
1.2.1 帧间预测的率失真编码效率 |
1.2.2 帧间预测码流的适配能力 |
1.2.3 运动信息的压缩 |
1.3 帧间预测技术的相关研究现状 |
1.4 本文的创新之处及论文组织 |
第二章 基础知识 |
2.1 视频编码的基本原理 |
2.1.1 视频的数字化表示 |
2.1.2 视频压缩技术 |
2.2 视频编码的标准化 |
2.3 主流视频编码标准简介 |
2.3.1 H.264/AVC |
2.3.2 H.264/SVC |
2.3.3 HEVC |
2.4 视频编码中的率失真优化 |
第三章 基于区域划分的运动矢量编码技术 |
3.1 基于区域划分的运动矢量预测方法 |
3.1.1 基于竞争的运动矢量编码回顾 |
3.1.2 基于区域划分的矢量竞争方法 |
3.1.3 面向多MVP编码方案的扩展 |
3.1.4 编码过程 |
3.1.5 解码过程 |
3.2 实验结果 |
3.2.1 KTA参考软件下的编码性能 |
3.2.2 HEVC参考软件下的算法性能 |
第四章 基于感兴趣区域及空间可重写的SVC编码方法 |
4.1 H.264/SVC码流的空间可重写技术 |
4.2 感兴趣区域可重写编码方法 |
4.2.1 感兴趣区域可重写编码中的数据依赖问题 |
4.2.2 本文提出的可重写SVC感兴趣区域编码方法 |
4.3 实验结果 |
4.3.1 可重写感兴趣区域编码方法实验结果 |
4.3.2 关于错误传播的讨论 |
第五章 基于辅助编码环路的SVC感兴趣区域编码方法 |
5.1 H.264/SVC中感兴趣区域编码技术 |
5.2 基于辅助环路的SVC感兴趣区域编码技术 |
5.2.1 运动搜索及模式选择的虚拟参考帧生成 |
5.2.2 拉格朗日乘子选取 |
5.3 实验结果 |
5.3.1 感兴趣区域率失真优化准则性能 |
5.3.2 优化拉格朗日乘数选择的性能 |
5.3.3 本文方法综合性能 |
第六章 总结与展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
四、基于率失真优化的递进UTCQ编码(论文参考文献)
- [1]基于人眼视觉系统特性的图像压缩算法及实现的关键技术研究[D]. 付东辉. 中国科学院大学(中国科学院长春光学精密机械与物理研究所), 2020(01)
- [2]视频压缩编码及其质量增强的优化技术研究[D]. 鲁国. 上海交通大学, 2020(01)
- [3]全景视频自适应传输技术研究与系统实现[D]. 徐景行. 上海交通大学, 2019(06)
- [4]基于感兴趣区域率失真优化的视频压缩编码通信系统设计[D]. 张哲为. 北京交通大学, 2019(01)
- [5]视频编码结构与优化算法研究[D]. 王宏宇. 电子科技大学, 2019(01)
- [6]虚拟现实视频图像编码优化算法研究[D]. 冷龙韬. 电子科技大学, 2019(01)
- [7]基于DSP的高清视频编码实时传输关键技术研究[D]. 乔莉. 中北大学, 2018(11)
- [8]基于统计模型进行率失真优化的加密图像压缩算法[J]. 冯阳,王春桃. 中山大学学报(自然科学版), 2017(05)
- [9]AVS2视频编码的语法元素分析及率失真技术中的码率估计算法[D]. 徐梦莹. 西南交通大学, 2016(01)
- [10]面向视频编码标准应用的帧间预测技术研究[D]. 王洪涛. 中国科学技术大学, 2015(09)