Автор: Михаил Попов Опубликовано в журнале "CIO" №7 от 28 июля 2003 года
За последние годы развитие вычислительных технологий достигло колоссального прогресса. Однако сегодня у многих складывается ощущение, что экстенсивное развитие — простое увеличение мощности процессоров, емкости накопителей, пропускной способности каналов — уже практически исчерпало свои ресурсы, и необходим качественный, концептуальный скачок в вычислениях.
Более или менее общим мнением в отрасли является взгляд на информационные технологии как на сервис, который должен использоваться по мере надобности, браться как бы ниоткуда в нужных объемах и качестве и при этом не доставлять хлопот в части обслуживания. В общем, что-то вроде сна Веры Павловны на тему коммуны, где все будет общее и притом в достатке. Не случайно в последнее время получили распространение термины utility computing, computing on-demand и другие, отражающие коммунальную сущность «мощностей по требованию». Разработки в этом направлении ведут как академические учреждения, так и компании, обладающие достаточным влиянием и возможностями установления отраслевых стандартов. И, конечно, на переднем крае, вернее, на одном из передних краев находится IBM, наиболее заметными инициативами которой являются «вычисления по требованию» (on-demand computing) и «автономные вычисления» (autonomic computing).
Задача on-demand computing — реализовать упомянутые выше идеи распределения ресурсов по потребности. Технология autonomic computing должна повысить надежность и управляемость вычислительных систем, снизив при этом сложность их эксплуатации. Чтобы реализовать все на практике, нужны новые технологии, которые мало разработать — нужно еще внедрить на рынок. И одна из первых по важности разработок такого рода — технология Grid.
Основа Grid — виртуализация ресурсов — идея сама по себе не новая. Новой является концепция разделения и совместного использования логических и физических устройств в сети. «Grid Computing можно обозначить как технологию распределенных вычислений в Интернете, — рассказывает вице-президент IBM по стратегическим бизнес-разработкам в странах Европы, Среднего Востока и Азии Мишель Тесседр. — Технологию Grid можно назвать третьим поколением Интернета. Его второе поколение мы наблюдаем сегодня. Для него характерно взаимодействие между двумя компьютерами: с одного мы можем присоединиться к другому и осуществить некую транзакцию. Третье поколение Интернета также позволит выполнять все это, но будет возможно и нечто большее: со своего компьютера вы сможете заставить работать на себя сеть компьютеров. В Интернете второго поколения компьютеры могут общаться с помощью XML. В Интернете третьего поколения роль универсального языка сможет выполнять OGSA (Open Grid Service Architecture — открытая архитектура Grid-сервисов), которая позволяет компьютерам не только общаться, но и совместно работать — в этом и заключается суть технологии. В качестве примера можно привести новый ускоритель элементарных частиц, строящийся сейчас в исследовательском центре CERN в Швейцарии. Когда он будет завершен, объем генерируемых данных достигнет пяти петабайт в год. Эта информация будет распределяться по сотне компьютеров во всем мире. Исследователи, которым она нужна, смогут получить ее в уже обработанном виде с этой сотни компьютеров: таким образом, здесь присутствует не только виртуализация хранилищ данных, но и виртуализация обработки данных».
Развитие мощных компьютеров сегодня идет по пути параллельных вычислений, реализуемых внутри монолитных высокопроизводительных систем или же внутри кластеров, состоящих из однотипных вычислительных единиц. Grid представляет новое направление, позволяющее использовать вычислительную мощность и системы хранения данных в гетерогенных системах. Те, кто знаком с основами параллельного программирования, могут оценить колоссальную сложность реализации эффективного взаимодействия компьютеров в них. Попытки такого рода уже были (можно вспомнить академический проект Condor), однако даже самая остроумная реализация платформы не получит распространения без поддержки со стороны middleware и конечных приложений.
Сегодня Grid широко применяется в научной сфере — в качестве примеров можно привести не только вышеупомянутый ускоритель, но и UK Science Grid, а также национальный маммографический проект в Великобритании. Grid активно используется в молекулярной биологии для моделирования структуры белка, анализа последовательностей ДНК и других применений. Технология начинает проникать и в бизнес — в нефтяную отрасль, в геологоразведку. Есть примеры ее использования в банковском деле, на площадках трейдинга, для предсказания рисков, составления портфеля. В автомобильной промышленности Grid позволяет ускорить и удешевить расчет виртуальных крэш-тестов. Крупнейшие авиастроители, такие, как Airbus и Boeing, используют технологию для постоянного контроля состояния двигателей и других агрегатов и узлов самолета: показания датчиков, непрерывно собирающих информацию, через спутник передаются на землю, где и анализируются в сетях Grid. В телекоммуникационной отрасли потенциальной областью использования Grid являются онлайновые игровые системы, такие, как Butterfly.net. Вначале в Butterfly.net одновременно участвовали всего несколько тысяч игроков, но с марта этого года к игровой сети могут подключаться консоли Sony Playstation, так что количество игроков, встречающихся в онлайне, может составить около миллиона.
IBM сама активно использует технологию Grid для внутренних нужд — по выражению Мишеля Тесседра, «мы сами едим то, что готовим»: «Основной областью использования в компании является моделирование при создании микропроцессоров следующих поколений, таких, как Power5 и Power6». Путь «из науки в бизнес» является типичным для многих новых технологий и разработок — достаточно вспомнить хотя бы сам Интернет. Академическая среда оказывается более гибкой и восприимчивой, особенно к тому, что позволяет экономить средства. Путь Grid в бизнес лежит через тесную работу с партнерами — разработчиками программного обеспечения и с заказчиками. Иногда развитие может пойти по новому руслу. «Занимаясь развитием направления Grid в IBM, я очень интересуюсь мнением наших клиентов. Полтора года назад они проявляли интерес к технологии, однако не очень хорошо представляли себе, как это все работает и чем может быть полезно в их бизнесе, и это привело нас к созданию Инновационного центра Grid в Монпелье, — рассказывает Мишель Тесседр. — Вначале мы считали, что Grid будет использоваться в основном для задействования простаивающих вычислительных компьютерных ресурсов с учетом нужд существующего ПО. Ведь производительность некоторых приложений может возрасти в десятки раз с минимальными затратами, путем, например, использования свободных вычислительных ресурсов ПК. Однако развитие пошло по другому пути — сейчас стало ясно, что 80–90% ПО составляют совершенно новаторские приложения, которые вообще не были бы возможны без Grid. Например, у одного немецкого банка процедура расчета инвестиционных рисков занимала 13 часов. Теперь, с использованием технологии Grid на Unix-кластере, они рассчитывают риски каждые 15 минут. Другой пример из банковского сектора США: клиент, которому необходимо взять значительную ссуду, обычно сообщает об этом банку телефонным звонком с подробностями о своем бизнесе, о цели кредита и т. д. В течение суток банк проводит анализ риска и сообщает клиенту о своем решении. Один из американских банков, внедривший у себя технологию Grid, сократил время на анализ риска с суток до одной минуты, так что ответ клиенту выдается сразу же. И в этом заключается конкурентное преимущество этого не самого крупного банка. Он никогда бы не купил компьютер достаточной для таких расчетов мощности и смог позволить себе такую услугу только благодаря технологии Grid».
Итак, во-первых, Grid позволяет вдохнуть новую жизнь в уже существующие технологии. И, во-вторых, Grid является основой для новых приложений, ранее не реализуемых. Нельзя сказать, что развитие идет без трудностей. Приложения, которые используются в бизнесе, да и в науке тоже, обычно приспособлены к какой-либо архитектуре и мало подходят для переделок. Чтобы решить эту проблему, IBM взаимодействует с независимыми разработчиками из различных областей, заключая соглашение о «гридификации» их приложений, которое будет вестись совместными усилиями. IBM предоставляет поддержку Grid в программном и аппаратном обеспечении, а также выполняет координирующие функции. «Мы помогаем создавать ПО, использующее технологию Grid, для разных сегментов — автомобильной и авиапромышленности, финансового сектора, сельского хозяйства, разработки полезных ископаемых, биологии. При этом применяется программное обеспечение как самой IBM, так и ее партнеров — WebSphere, Tivoli, DB2, GPFS, Globus и т. д. Очень важный момент для заказчика заключается в том, что он не покупает Grid, он строит Grid, решая свои бизнес-задачи. И мы можем помочь в этом построении», — говорит Мишель Тесседр.
Во взаимодействии с разработчиками, однако, могут встречаться свои подводные камни. Следующим этапом развития должна стать «гридификация» бизнес-приложений — ERP и CRM, которая может столкнуться не с технологическими трудностями, но с проблемами иного рода. Более эффективное использование вычислительных ресурсов, которое дает Grid, может привести, например, к уменьшению количества продаваемых лицензий на ПО и тем самым войти в конфликт с моделью бизнеса, например, поставщика ERP-систем. Может возникнуть вопрос, как производить расчет количества выдаваемых лицензий на ПО для вычислительного центра, предоставляющего свои ресурсы пользователям в разных странах. «Как скоро эти вопросы будут решены — неизвестно, однако рано или поздно это произойдет, потому что налицо давление со стороны заказчиков, а мы живем в век диктата заказчика», — подчеркивает Мишель Тесседр.
С точки зрения разработчика, поддержка Grid реализуется в программных средствах нескольких уровней — на уровне системного ПО, middleware и конечных приложений. В прошлом году компанией IBM и проектом Globus была представлена совместная разработка системного уровня под названием «открытая архитектура сервисов Grid (Open Grid Service Architecture — OGSA)». Третья версия программного инструментария Globus Toolkit, которая включает в себя OGSA, должна выйти в июле под свободной лицензией. ПО более высокого уровня — для построения кластеров и управления ими — будет частично открытым, частично — являться собственностью разработчиков. Многие разработки должны войти в программный пакет WebSphere. Тем, кто обдумывает внедрение Grid, в IBM советуют сосредоточиться на одном из приложений, важных для бизнеса в плане возврата инвестиций, и оценить возможность его внедрения с использованием Grid. Естественно, что технология сама по себе не приносит успеха, и в каждом конкретном случае необходимо решать вопрос о ее сочетаемости с практикой бизнеса.
Зачем IBM нужно не только разрабатывать Grid на системном уровне, но еще и делиться этими разработками со всеми остальными под свободной лицензией? Ведь, казалось бы, использование «дешевых» распределенных компьютерных мощностей, которые позволяет задействовать Grid, может отрицательно сказаться на бизнесе компании по продаже мощных монолитных вычислительных систем, которыми всегда была сильна IBM? Во-первых, то, что не сделаешь ты, за тебя сделают конкуренты. Во-вторых, многие приложения требуют больших вычислительных ресурсов на одной машине и не могут быть в достаточной степени параллелизованы. Кстати, в IBM подчеркивают, что Grid может быть реализована не только на Linux-кластерах, но и на любых архитектурах мощных SMP-серверов — и она присутствует в каждом крупном проекте высокопроизводительных систем, построенных компанией в прошлом году.
В каких областях можно применить Grid на развивающихся ИТ-рынках, к которым относится и российский? Мишель Тесседр считает, что технологии Grid могут быть использованы в первую очередь в государственных учреждениях и образовании: «Для вашей страны может оказаться очень выгодно использовать Grid-технологии на платформе Linux — это может сэкономить большие средства. В Европе некоторые местные правительства отказываются от ПО Microsoft в пользу Linux, пытаясь выбраться из клетки, в которую уже попали. Мой совет — не попадайтесь в эту клетку. В некоторых областях, таких, как биологические исследования, нефтяная отрасль, финансовая отдача от использования Grid может быть получена уже в ближайшей перспективе. Начать необходимо с разработки приложений, технология Grid сама по себе не сделает вас богатыми».
Светлана Бачурина: «Главное – системный подход к ИТ» О текущем этапе информатизации деятельности Правительства Москвы рассказывает Светлана Бачурина, советник первого заместителя мэра Москвы, главный конструктор программы "Электронная Москва"
ИТ-обучение: эволюция возможностей Российское ИТ-образование за 20 лет прошло эволюционный путь вместе с ИТ-рынком, не только отвечая на его запросы, но и активно участвуя в его формировании. Образование будущего станет полностью базироваться на ИТ.
ИТ и безопасность городов О проблемах построения комплексных систем безопасности в госсекторе РФ наш портал побеседовал с Андреем Бадаловым, членом Экспертного совета Комитета Государственной Думы РФ по безопасности.
«Объединяющие Миры» HP В новых экономических условиях очень важно, чтобы бизнес и ИТ говорили на одном языке и стремились к общим целям. Такая идея легла в основу Форума «Программные миры HP», который пройдёт 16 сентября в Москве.
SaaS в госсекторе и бизнесе. Одни проблемы? Тормозящими факторами развития SaaS является малая осведомленность рынка в России о преимуществах использования ПО в аренду, недоверие к SaaS разработчикам, а также малое количество продуктов