2021-06-01发表2023-02-16更新 Erial 分布式12 分钟读完 (大约1754个字)分布式chap-3第三章 并行程序设计Foster 方法划分、通信:处理与机器无关的问题,影响并发性和可扩展性聚合、映射:处理与机器有关的问题,影响局部性和其他性能问题 划分将要执行的指令和数据按计算部分拆分成多个小任务。关键在于识别出可以并行执行的任务 通信确定划分的任务之间需要执行哪些通信阅读更多
2021-05-30发表2023-02-16更新 Erial 分布式25 分钟读完 (大约3746个字)分布式chap.1第一章 Architecture大纲(outline) 冯诺依曼模型的修改 分布式硬件 弗林分类法 共享内存系统和分布式存储系统 内存层次结构和缓存一致性 互联网络 分布式软件 输入输出 阅读更多
2019-12-07发表2023-02-16更新 Erial 10 分钟读完 (大约1536个字)cuda1CUDA 介绍CPU :面向延迟设计image-20210607010547778(C:\Users\Aerialith\AppData\Roaming\Typora\typora-user-images\image-20210607010547778.png ALU 减少操作延迟 Cache 将长延迟内存访问转换为短延迟缓存访问 控制模块 - 分支预测以减少分支延迟 - 数据转发以减少数据延迟阅读更多