嵌入式图形系统的访存带宽优化

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:leezero666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图形处理单元(Graphics Processing Unit,GPU)从问世以来便迅速发展,并很快成为计算机系统中不可或缺的重要组成部分。目前GPU已在低端嵌入式系统、个人桌面应用、图形工作站乃至高性能计算等各个领域得到广泛应用。近年来嵌入式图形系统和移动图形学(Mobile Graphics)更是因为作为载体的手机数量持续快速增长和巨额市场利润的驱动而呈现出强劲的发展势头。   嵌入式图形系统不同于桌面图形系统,在处理器运算能力、存储器容量和带宽、功耗等方面面临更多的约束。存储器带宽通常是图形系统的瓶颈所在,内存带宽对嵌入式图形系统性能的制约作用更加凸显。嵌入式图形系统中GPU没有专用存储单元,图形处理过程中所需要的各种数据都存放在内存里,图形流水线产生的最终结果也需要存放在帧缓冲区内。   本文结合龙芯2F南桥芯片中集成GPU的工作,围绕图形系统带宽开销的几个来源,包括纹理带宽、颜色缓冲区带宽以及帧缓冲区带宽,进行了一系列优化工作。本文的主要贡献和创新点体现在以下几个方面:   1.LAC(Loonqson Alpha Compression):具有可变数据格式的透明度压缩访问纹理内存往往最消耗图形系统的带宽资源,因此纹理压缩技术在图形系统中得到了广泛应用。纹理压缩包括对纹理图像透明度通道的压缩和颜色通道的压缩。本文分析了透明度和颜色的本质差异,提出了具有可变数据格式的透明度压缩方法LAC。LAC定义了新的透明度压缩数据格式,并引入聚类算法实现了透明度压缩过程。实验结果表明,与当前标准纹理压缩算法S3TC/DXT5的透明度压缩相比,LAC可使测试图像的平均PSNR值提高0.25 dB,透明度数据的平均压缩时间缩短约18%,硬件实现的平均单元面积减小25%左右,解压功耗降低10%~30‰   2.LTC(Loongson Texture Compression):具有可变数据格式的纹理压缩LAC不仅能改善S3TC的透明度压缩,而且还可将其数据格式中空闲位置用于纹理图像颜色通道的压缩,以进一步提高纹理图像的压缩质量。本文分析了图形系统中透明度和颜色计算方法和应用方式的差异,在LAC的基础上提出了具有可变数据格式的纹理压缩方法LTC。LTC定义了新的纹理压缩数据格式,兼容LAC透明度通道压缩方法,并将小波变换引入颜色通道压缩。与S3TC相比,LTC能使颜色通道的平均PSNR值提高4.56 dB,并显著改善S3TC在物体轮廓处所产生的视觉缺陷。   3.LCBC(Loongson Color-Buffer Compression):场景前颜色缓冲区压缩访问颜色缓冲区导致的带宽开销是系统带宽开销的重要组成部分。本文分析了图形流水线中颜色缓冲区的访问过程,总结了颜色缓冲区压缩应具备的一般特征,在纹理压缩算法S3TC的基础上提出了颜色缓冲区压缩方法LCBC。LCBC降低了50%的颜色缓冲区带宽开销,并简化了S3TC的压缩和解压过程,进一步提高了压缩图像的质量。与S3TC相比,LCBC的两种数据格式能使测试图像的平均PSNR值分别提高7.87 dB和13.40 dB。   4.LFBC(Loongson Frame-Buffer Compression):颜色无损的帧缓冲区压缩GPU渲染后的场景存放在帧缓冲区内,由显示控制单元DC送往显示器显示。DC对帧缓冲区的访问不仅消耗一定的内存带宽,同时也是嵌入式图形系统功耗的重要来源之一。本文结合DC线性访问帧缓冲区的特征,提出了帧缓冲区压缩的抽象模型,分析得到帧缓冲区压缩率与帧缓冲读/写比的关系,揭示了帧缓冲区压缩与具体应用的联系。以此为指导提出了颜色无损的帧缓冲区压缩方法LFBC,定义了新的压缩数据格式,用游程编码实现了压缩过程。对适合进行帧缓冲区压缩的应用,LFBC降低了50%~80%因DC访问帧缓冲区所带来的带宽开销。   本文从实际工作出发,以图形系统带宽方程为中心,紧密围绕带宽方程的各个分量进行了一系列工作,部分研究成果已在工程实践中得到应用。本文提出的具有可变数据格式的纹理压缩,能替代S3TC作为新的纹理压缩标准,这将对现有的图形硬件产生积极影响;文中分析得到的帧缓冲区压缩率表达式,揭示了帧缓冲区压缩和具体应用的联系,对当前的研究工作具有重要意义。  
其他文献
域名系统(Domain Name System,DNS)是重要的互联网基础设施,主要功能是负责域名和IP地址的相互转换。DNS的正常运行,是WWW、Email、FTP等众多互联网服务正常工作的基础。  
本课题主要是开发一套基于3G网络的远程监护系统。系统包括两个部分,为老年人和慢性病患者设计一款可以在家中或户外使用的便携式监护终端设备以及医生工作站软件部分。系统硬
LTE(Long Term Evolution,长期演进)作为一种新的无线接入技术,其目标是达到上行50Mbps、下行100 Mbps的吞吐率。高吞吐率的要求是下行turbo译码的一个很大挑战。Turbo译码复杂
人体动作识别是计算机视觉领域的关键问题,在多个领域有着广阔的应用前景。由于存在背景复杂、摄像机运动、遮挡和物体变化等因素,使得如何提取“好”的特征以及获取鲁棒的特征
近年来,业务流程的广泛使用极大的提高了企业的生产效率,增加了企业的核心竞争力。但随着社会的不断发展,企业的业务目标也在不断调整,对业务流程的柔性调整的要求也越来越高。目
情境感知是普适计算中一项重要的研究内容,有着极大的应用前景,可广泛应用于各种服务和应用,如医疗监护、智能家居/办公、社交网络、商业推荐等方面。其中,基于移动终端平台的情
随着集成电路制造工艺的发展,工艺偏差、时延缺陷、串扰效应以及电源噪声等将对芯片的定时产生更加严重的影响,并可能导致芯片的时延故障。为了确保芯片工作的可靠性,非常有必要
加权概念格是针对属性的重要程度,通过引入内涵权值而形成的一种格结构,并通过引入虚结点概念,保证了格结构的完备性。本文,对加权概念格的渐进式构造以及分类规则提取进行了
自动人脸识别技术经过几十年的发展,在可控条件下已经可以达到比较理想的性能。然而,在环境变化剧烈的情况下,人脸识别的性能会急剧下降。现有的人脸识别方法通常是基于较低分辨
现有的计算智能算法主要模拟了物理化学规律及动物的社会行为,对于植物的生长模式尚未给予足够重视。由于植物对环境的适应能力较强,生长速度较慢,因此,模拟植物的生长过程为