YARN
YARN (Yet Another Resource Negotiator) предназначен для того, чтобы приложения могли использовать ресурсы кластера общим, безопасным образом.
resource manager (disk, memory, CPU)
job scheduler (YARN applications)
data operating system
Необходимо знать топологию кластера, чтобы эффективно планировать и оптимизировать доступ к данным
Components of YARN:
Resource Manager - это компонент уровня кластера, работающий на главном компьютере (Master machine). Следовательно, он управляет ресурсами и планирует приложения, работающие поверх YARN.
Он состоит из :
планировщик (Scheduler)
диспетчер приложений (Applications Manager)
Node Manager - Это компонент уровня ноды. Он работает на каждой salave машине. Он постоянно общается с Resource Manager, чтобы оставаться в курсе того, какие ресурсы, где требуются
Application Maters - управляет жизненным циклом для каждого приложения, согласовывает ресурсы с RM, работает с NM для выполнения и мониторинга задач
Yarn может взаимодействовать с HDFS для получения информации о местонахождении данных (data locality) для оптимизации обработки задач.
Last updated
Was this helpful?