- 先进二级缓存控制器:ARM二级缓存控制器(PrimeCell PL310)与Cortex-A9系列处理器同步设计,旨在提供一种能匹配Cortex-A9处理器性能和吞吐能力的优化二级缓存控制器。PL310最多可为每个接口提供8项AXI事务支持,支持按Master接口进行锁定;这样一来,即通过将PL310用作加速器与处理器之间的缓冲器,充分利用一致性加速口,实现多个CPU或组件之间的可控共享,既提升了系统性能,也降低了相关功耗水平。
- 另外,PL310不但具有Cortex-A9先进总线接口单元的各项功能,支持同步1/2时钟比,有助于减少高速处理器设计中的延时现象,而且能够对第二MasterAXI 接口设置地址过滤,分割地址和频率域、以及集成片上内存的快速存取提供了支持。PL310最高可支持2MB的四至十六路组相联二级缓存,可与奇偶校验及支持E C C的R A M集成,而且运行速率能够与处理器保持一致。而先进的锁定技术也提供了必要的机制,从而将缓存用作相关性加速器和处理器之间的传输RAM。
- Cortex-A9 程序跟踪宏单元(PTM):Cortex-A9 PTM为两款Cortex-A9处理器提供了兼容ARM CoreSight技术的程序流跟踪功能,能够对处理器中的实际指令流实现完全可视化的管理。Cortex-A9 PTM通过周期计数实施性能分析,可对所有代码分支和程序流变动进行跟踪管理。
- Tegra 2之所以强大除了采用两颗频率高达1Ghz的Cortex-A9处理器之外,另外一个非常重要的原因就是它在手持设备中引入了强大的Geforce处理器,借助于Geforce处理器的强大性能,可以为Tegra 2提升3D图形性能以及加速网页浏览等诸多功能。下面我们就来说说Tegra 2里面非常重要也非常强大的Geforce处理器。
- Tegra 2的GeForce内核实现了功能强劲的管线顶点和像素处理架构,可通过各种特性降低功耗和提高图形质量,支持下一代移动 3D 游戏、流畅的高清视频播放、在线 Flash 游戏性能和高度响应的移动 GPU 加速用户界面,而不会影响移动电源预算。
- OpenGL ES 是一个标准的应用程序编程接口 (API),开发人员可使用它为智能电话、平板设备和便携式游戏设备等移动设备编写图形应用程序。OpenGL ES API是桌面OpenGL API 规范的一个子集,并且在图形应用程序和 GPU 硬件之间定义了一个灵活而强大的低级接口。最新的 OpenGL ES 2.x 规范针对完全可编程的现代 GPU 管线,并将 API 的所有固定函数元素替换为可编程着色。大多数移动 GPU 架构均采用OpenGL ES API 标准,并且主要根据OpenGL ES API 的定义来实现逻辑处理管线。
- 为了显示游戏或图形应用程序中定义的场景,应用程序开发人员必须先使用3D建模软件创建各种3D对象和角色模型。每个对象和角色都可以由数百、数千甚至数百万个相互连接的三角形网格构成,具体取决于所需的几何真实水平。
- 接下来3D游戏软件或其他3D应用程序可以使用这些模型,并将它们置于模拟的3D场景或“3D世界”中。3D世界通过XYZ坐标系定义,并且3D对象或角色将放置在3D世界的特定位置上。对象中的每个三角形都由它的三个顶点定义,并且每个顶点都由代表其属性的一组数值构成,这些属性包括在3D世界中的XYZ位置、颜色值 (RGB)、阿尔法透明度、纹理坐标、法线等。随后,定义对象特定部分的顶点集将分组到一个顶点缓冲区中,后者类似于原始顶点流。
- 3D软件会向GPU驱动程序发起一个OpenGL ES调用,指向共享系统内存中的顶点缓冲区位置,从而允许 GPU 直接访问和处理数据。OpenGL管线的原型处理阶段发生在GPU中,并且会将传入顶点数据转换为可供GPU使用的格式和组织。随后,顶点会传递至Vertex着色器;这时,顶点着色器程序可以运行各种矩阵转换和光照计算,以便将顶点移至新的X、Y和Z位置,或者改变灯光值等属性。
- 转换后的顶点将被组装为原型, 然后光栅化阶段会将原型转换为像素片段,为像素着色器阶段做准备。现在,像素片段处于2D屏幕空间格式。像素着色阶段将运行像素着色器程序来处理每一个像素,并且可能会应用新的照明或颜色值、应用纹理或者执行各种其他操作来计算应用于像素的最终颜色值。
- 在典型的OpenGL管线中,随后会对各个像素运行Z缓冲测试,以确定是否比帧缓冲区中的相同屏幕位置中的已有像素更加接近观众的眼睛。如果确定新像素更加接近观众,它会取代帧缓冲区中的已有像素值,但如果它在已有像素后面,则会被丢弃。(注意:帧缓冲区可能位于与CPU共享的系统内存空间中,或者可能位于专用内存中,比如大多数独立显卡所使用的内存)。
- 如果可见像素的 Alpha 值指示它是部分透明的,那么它将与相同屏幕位置的帧缓冲区中的已有像素相混合。如果启用了抗锯齿,那么可以通过修改像素的颜色值来创建更加平滑的边缘,以便在写入帧缓冲区中之前减少锯齿效果。
- 双核处理器或许让消费者对于Tegra 2的功耗问题比较担心,而双核处理器再加上GeForce内核,顿时让很多人对于Tegra 2的功耗问题更加怀疑和关注。的确,现在手机续航时间短已经成为智能手机的一个普遍现象,而Tegra 2同样也绕不开功耗的问题,下面我们就来看看Tegra 2中的GeForce内核架构以及它如何实现功耗的控制。
- GeForce架构是一种固定函数管线架构,包括完全可编程的像素和顶点着色器,以及一个先进的纹理单元,可支持高品质的各向异性过滤。