Графические ускорители Mali характеристики сравнение моделей.
Графические процессоры Mali — интеллектуальная собственность компании ARM Limited, является графической частью микропроцессорной архитектуры ARM, применяемой при производстве кристаллов SoC, хорошо известных как — мобильные процессоры Snapdragon, Helio, MT, Exynos, Kirin.
ARM Limited разрабатывает архитектуру процессора, ]MediaTek[/anchor], Qualcomm, HiSilicon, Samsung — покупают лицензию, с соответствующей документацией. Вносят свои коррективы — выбирают класс, поколение, количество ядер и частоту CPU, изменяют финальные характеристики GPU Mali: количество вычислительных блоков и частоту работы. Обособленное место занимает продукция Qualcomm, при производстве мобильных процессоров используют графические ускорители собственной разработки — Adreno.
Для простоты восприятия, основной строительный материал графических процессоров — вычислительные блоки, в характеристиках процессоров обозначается как — MP (Mali T830 MP2, к примеру). Количество этих «умных» кирпичиков, в тандеме с частотой — определяет производительность видеоускорителя. В таблице характеристик Mali вы можете наблюдать показатели GFLOPS (количество операций в секунду, с запятой), первое значение — это пиковая производительность 1 блока на минимальной частоте, второе значение — теоретический потенциал, при работе всех блоков на максимальной частоте.
Показатели частоты, размеры, тепловыделение, энергоэффективность во многом зависят от применяемых норм производства (nm), двойные значения в этом столбике указывают на то, что чипы производятся или производились с применением разных норм, на усмотрение производителя.
В теории всё предельно просто — чем новее архитектура, больше блоков и выше частота, тем выше быстродействие. На практике, максимальное количество вычислительных блоков графических ускорителей Mali в смартфонах мы так и не увидим, это удел мини-ПК и ноутбуков, где есть маломальская система охлаждения. На сегодняшний день зафиксированный максимум для Mali-G72 это MP18 (18 блоков) — мобильный процессор Samsung Exynos 9810, для сравнения Mali-G71 это MP20 — Samsung Exynos 8895. Намечается выход нового чипсета HiSilicon Kirin 980 с графикой нового поколения Mali-G76 MP10, производительность обещает быть выше графики Adreno 630, используемой в Snapdragon 845.
Для полноты картины, рекомендую воспользоваться следующей информацией — рейтинг производительности мобильных процессоров, где вы сможете сравнить — заявленные разработчиком ARM теоретические возможности Mali, с характеристиками и производительностью произведённых процессоров. Упорядочить мысли, собрать недостающие пазлы помогут профессиональные советы — как выбрать смартфон правильно.
Видео процессоры Mali характеристики:
Модель | nm | Вычислит. блоки | Частота | GFLOPS | OpenGL | DirectX | Vulkan |
Mali-G76 | 7 | от 4 до 20 | 750 MHz | — | 3.2 | 12 | 1.1 |
Mali-G72 | 10 16 | от 1 до 32 | 546-850 MHz | от 18.6 до 924.8 | 3.2 | 12 | 1.1 |
Mali-G71 | 10 16 | от 1 до 32 | 546-1037 MHz | от 18.6 до 1128 | 3.2 | 11 | 1.1 |
Mali-G52 | 16 | от 1 до 4 | 850 MHz | от 86.7 до 346.8 | 3.2 | 11 | 1.1 |
Mali-G51 | 10 28 | 1 uni-pixel 3 dual-pixel | 650 MHz | — | 3.2 | 11 | 1.1 |
Mali-G31 | 28 | от 1 до 2 | 650 MHz | — | 3.2 | 11 | 1.0 |
Mali-T880 | 28 | от 1 до 16 | 650-1000 MHz | от 22.1 до 544 | 3.2 | 11 | 1.0 |
Mali-T860 | 28 | от 1 до 16 | 350-700 MHz | от 11.9 до 380.8 | 3.2 | 11 | 1.0 |
Mali-T830 | 28 | от 1 до 4 | 600-950 MHz | от 20.4 до 129.2 | 3.2 | 11 | 1.0 |
Mali-T820 | 28 | от 1 до 4 | 600 MHz | от 20.4 до 81.6 | 3.2 | 11 | 1.0 |
Mali-T760 | 28 | от 1 до 16 | 600-772 MHz | от 20.4 до 420 | 3.2 | 11 | 1.0 |
Mali-T720 | 28 | от 1 до 8 | 400-700 MHz | от 6.8 до 95.2 | 3.2 | 11 | 1.0 |
Mali-T628 | 28 32 | от 1 до 8 | 533-695 MHz | от 17 до 177.9 | 3.1 | 11 | — |
Mali-T624 | 28 32 | от 1 до 4 | 533-600 MHz | от 17 до 76.8 | 3.1 | 11 | — |
Mali-T622 | 28 32 | от 1 до 2 | 533 MHz | от 17 до 34.1 | 3.1 | 11 | — |
Mali-T604 | 28 32 | от 1 до 4 | 533 MHz | от 17 до 68.2 | 3.1 | 11 | — |
Mali-470 | 28 40 | от 1 до 4 | 250-650 MHz | — | 2.0 | — | — |
Mali-450 | 28 40 | от 1 до 8 | 300-750 MHz | от 4.5 до 71.7 | 2.0 | — | — |
Mali-400 | 28 40 | от 1 до 4 | 200-600 MHz | от 1.8 до 19.2 | 2.0 | — | — |
Mali-300 | 28 40 | 1 | 500 MHz | 5 | 2.0 | — | — |
Модель | nm | Вычислит. блоки | Частота | GFLOPS | OpenGL | DirectX | Vulkan |
Графический ускоритель Mali — это один из интегрированных модулей SoC кристалла. Производители мобильных процессоров HiSilicon (Kirin), Samsung (Exynos), MediaTek (Helio, MT) определяют сколько вычислительных блоков «установить» и на какой частоте смогут работать. В свою очередь, производители смартфонов, в борьбе с тепловыделением (нагревом) кристалла, вносят свои коррективы. Заявленная частота далеко не всегда является реально рабочей, сравнение Mali в рамках одной модели процессоров (идентичных) показывает существенное расхождение в результатах тестов. Независимо от поколения, тестируем устаревшие Mali-400, уходящие Mali-T880 или новые Mali-G — разброс присутствует всегда. Стоя перед выбором Mali vs Adreno — сравнивайте производительность конкретных смартфонов, ссылка на рейтинг над таблицей.
ARM Cortex-A76 и Mali-G76: с прицелом на Windows и ноутбуки
Как раз до начала нынешней выставки Computex британский разработчик процессоров ARM представил новые ядра CPU. По сравнению с предшественниками, ядра Cortex-A76 обеспечат прирост производительности до 35%, но более интересны другие подробности. Дело в том, что для новых ядер сферой использования упоминается Windows. Впрочем, и в смартфонах мы наверняка их тоже увидим.
По сравнению с Cortex-A75, которые являются основой для ядер Qualcomm Kryo 385 (Snapdragon 845), ARM подчеркивает четыре основных преимущества.
Блоки предсказание ветвлений и выборки команд теперь разделены, что должно снизить задержки при высоких нагрузках. Передняя часть конвейера способна обрабатывать четыре-восемь инструкций за такт, также произошли изменения в системе кэширования инструкций. Второй пункт касается этапа декодирования команд: ядро способно обрабатывать четыре инструкции на такт — больше, чем у предыдущих поколений. Число обрабатываемых микроопераций за такт увеличилось до восьми. В-третьих, ARM указывает более высокую пропускную способность целочисленных и векторных вычислений. Что должно положительно сказаться в сегменте машинного обучения. Наконец, отметим оптимизированную иерархию кэша. Что вместе с блоком предварительной выборки 4-го поколения должно существенно увеличить производительность.
Многочисленные изменения должны привести к увеличению целочисленной производительности на 90% по сравнению с Cortex-A73, производительность с плавающей запятой должна увеличиться на 150%. В целом, как указывает ARM, прирост по сравнению с ядрами, вышедшими два года назад, составляет 80%; по сравнению с Cortex-A75 — 35%, хотя ARM здесь использует разные тактовые частоты: 2,45 ГГц для Cortex-A73, 2,8 ГГц для Cortex-A75 и 3,0 ГГц для Cortex-A76.
«Производительность ноутбука», рассчитанная на основе AArch64 Specint2K6, должна быть существенно выше, чем у предыдущих поколений. Однопоточная производительность на 110% превышает Cortex-A73, что касается кластера Big.little с энергопотреблением 5 Вт, производительность будет на 90% больше. Но в данном сравнении тактовые частоты уже не приводятся.
В целом, по сравнению с прошлогодним Cortex-A75, ARM указывает прирост производительности на 35% в целом, в четыре раза более высокую производительность машинного обучения и на 40% более высокую эффективность. Последняя связана с переходом на новый техпроцесс. Cortex-A76 будут выпускаться по оптимизированному техпроцессу TSMC 7 нм FinFET, но ARM также упоминает и 16-нм техпроцесс FFC TSMC. Разработчики SoC, которые готовы довольствоваться 16-нм техпроцессом, могут приступать к работе уже сейчас. Что касается 7 нм, то здесь начать работу раньше четвертого квартала не получится.
Что касается кластера DynamIQ, то ARM видит в нем лучшего партнера новым ядрам — Cortex-A55, которые были представлены в прошлом году. Они будут работать в качестве эффективных ядер.
Также ARM представила и графическое ядро GPU Mali-G76. Основное изменение по сравнению с предыдущим флагманом Mali-G72 заключается в удвоении блоков АЛУ, что связано с удвоением ширины SIMD. Но мы по-прежнему получаем архитектуру Bifrost, представленную в 2016 году, с тремя исполнительными движками на ядро. Но максимальная производительность увеличится всего на 25%, что связано с уменьшением возможного числа ядер. Если у Mali-G72 были возможны конфигурации с 32 ядрами (MP32), то сейчас пределом будет 20 (MP20). Впрочем, на практике это вряд ли будет играть роль, поскольку к данному пределу производители не подходили — даже у SoC Samsung Exynos 9810, которая используется в Galaxy S9+ (тест), доступны только 20 ядер. Кроме прироста производительности ARM упоминает на 30% более высокую эффективность и на 170% более высокую производительность машинного обучения.
Когда выйдут первые SoC на Cortex-A76 или Mali-G76, пока неизвестно. Но, скорее всего, ими станут Huawei Kirin 980 и новый high-end чип Samsung, они будут представлены в начале января 2020. Вполне возможно, что и преемник Snapdragon 845 будет использовать в качестве основы новые ядра CPU. Гораздо больше вопросов вызывает ориентация ARM на Windows или Windows on ARM. Платформу пока нельзя назвать успешной. Впрочем, здесь вина не ARM, а Microsoft и первых трех OEM — ASUS, HP и Lenovo.