Предметная область и структура информатики

Последняя информационная революция второй половины 20-го века, связанная с изобретением и развитием микропроцессорной технологии и созданием современных информационных коммуникаций, компьютерных сетей и систем передачи данных, привела к созданию новой отрасли — информационной индустрии, направленной на производство технических средств и создание новых технологий производства знаний. Возникновение новой индустрии производства знаний привело к глобальным изменениям в обществе — информатизации общества — вовлечению всех его членов в общий процесс производства и реализации знаний на базе новых компьютерных и телекоммуникационных технологий и потребовало от всех его членов определенного уровня информационной культуры,определенных базовых знаний и умения целенаправленно использовать в своей деятельности современные информационные технологии, технические средства и методы. Научным фундаментом процесса информатизации современного общества и развития информационной индустрии является новая научная дисциплина — информатика.

Термин информатика произошел от слияния двух французских слов Informacion (информация) и Automatique (автоматика) и дословно определял новую науку об "автоматической обработке информации". В англоязычных странах этому термину соответствовал синоним Computer Science (наука о компьютерной технике).

Всовременном толковании информатикаэто комплексная научно-инженерная дисциплина, изучающая различные аспекты разработки, проектирования, создания, оценки, функционирования различного рода технических информационных систем (ИС), предназначенных для автоматизации информационных процессов сбора, хранения, поиска, отображения, обработки и передачи данных средствами современной вычислительной, информационно-измерительной техники и современных средств связи, а также изучающая вопросы применения этих систем и их воздействия на различные области социальной практики (по материалам сессии годичного собрания Академии наук СССР 1983 г.). В таком широком толковании информатика объединяет и использует достижения целого ряда научно-технических направлений, связанных с разработкой:

современных технических средств (hardware) сбора, хранения, поиска, отображения, обработки и передачи данных в ИС, а также технологий их создания и использования;

математических моделей естествознания и общественных явлений с целью их формализации, численных и логических методов решения задач, возникающих при построении и реализации этих моделей;

алгоритмических (brainware) и программных (software) средств автоматизации информационных процессов сбора, хранения, поиска, отображения, обработки и передачи данных в ИС.

Этот комплекс научно-технических дисциплин, как фундаментального, так и прикладного характера, позволяющих рассмотреть весь широкий круг проблем, возникающих при разработке и применении автоматизированных ИС, и представляет собой структуру нового научно-технического направления называемого информатикой.

Как и в других фундаментальных науках (физика, химия, биология, математика и др.), в информатике можно выделить различные стороны одного и того же объекта - информации. В связи с этим информатику можно условно разделить на ряд направлений, взаимосвязанных друг с другом.

Теоретическая информатика - это математическая дисциплина, содержанием различных составных дисциплин которой являются создание информационных моделей и средств работы с информацией и изучение их свойств. Использованные в ней методы исследования опираются на идеи и понятия дискретной математики.

Теоретическая информатика распадается на ряд самостоятельных дисциплин, которые условно можно разделить на пять классов:

I. К первому классу относятся дисциплины, опирающиеся на математическую логику. В них разрабатываются методы анализа процессов переработки информации с помощь компьютеров (теория алгоритмов, теория параллельных вычислений), а также методы, изучающие на основе моделей логического типа процессы, протекающие в самом компьютере (теория автоматов, теория сетей Петри.)

II. Второй класс - это вычислительная математика и вычислительная геометрия, позволяющие свести решения математических задач к последовательности выполнения элементарных операций над числами с целью возможности их реализации на компьютерах.

III. Изучением информатики как таковой, выявлением общих свойств информации, законов, управляющих ее рождением, развитием и уничтожением, занимается теория информации. К ней близко примыкает теория кодирования. В теории информации имеется раздел, специально занимающийся вопросами передачи информации по различным каналам связи.

IV. Переход от реальных объектов к моделям, которые можно использовать для изучения и реализации в компьютерах, требует развития особых приемов, изучением которых занимается системный анализ. Частью системного анализа является общая теория систем. Пограничное положение между теоретической информатикой и кибернетикой занимают две науки - имитационное моделирование и теория массового обслуживания.

V. Последний класс дисциплин, входящих в теоретическую информатику, ориентирован на использование информации для принятия решений в различных ситуациях. Изучением общих схем, используемых при выборе нужного решения, занимается теория принятия решений. Если выбор происходит в условиях конфликта, то это является предметом теории игр. Выбор оптимального решения изучается в дисциплине математическое программирование . При организации поведения, ведущего к нужной цели, принимать решения приходится многократно. Поэтому выбор отдельных решений должен подчиняться единому плану. Изучением способов построения таких планов и их использованием занимается научная дисциплина исследование операций.

Родоначальницей информатики является кибернетика, возникшая в конце 40-х годов прошлого века. В ее основу положены понятия управления и информации. Основоположником кибернетики является американский математик Норберт Винер.

Кибернетика сыграла большую роль в возникновении структурной лингвистики.

Наиболее активно развивается техническая кибернетика. В ее состав входит теория автоматического управления, которая стала теоретическим фундаментом автоматики. С теорией автоматического управления связана техническая диагностика, в задачи которой входят контроль за функционированием систем и поиск повреждений в них.

Заметное место в кибернетике занимает теория распознавания образов. Ее задача - поиск решающих правил, с помощью которых можно было бы классифицировать многочисленные явления реальности, соотносить их с некоторыми эталонными классами. Она является пограничной наукой между кибернетикой и искусственным интеллектом.

Использованием принципов работы живых систем в искусственных объектах занимается бионика. Нейрокибернетика пытается применить кибернетические модели в изучении структуры и действия нервных тканей.

Достижение равновесия при взаимодействии многих систем, соперничающих между собой, рассматривается в гомеостатике - недавно возникшей и еще находящейся в стадии оформления науке.

Кибернетика может рассматриваться как прикладная информатика в области создания и использования автоматических или автоматизированных систем управления разной степени сложности - от управления отдельными объектами до сложнейших систем управления целыми отраслями промышленности, банковскими системами, системами связи и даже сообществами людей.

Аппаратным фундаментом информатики является вычислительная техника, представляющая собой вполне самостоятельное направление исследований. В рамках этого направления решается немало задач, не имеющих прямого отношения к информатике. Например, ведутся многочисленные исследования, направленные на совершенствование элементной базы вычислительных машин. Основное содержание микроэлектроники составляют теория, методы расчета и технология изготовления интегральных микросхем, больших интегральных схем и сверхбольших интегральных схем (БИС, СБИС). Но, конечно, развитие современной информатики немыслимо без компьютеров - основного и пока единственного инструмента для работы с разнообразной информацией.

Эффективное использование компьютеров невозможно без знания их архитектуры и принципов функционирования. Они не работают вне специально созданных для них операционных систем, тестирующих программ, трансляторов - всего того программного обеспечения, которое составляет программную среду, где “существует” вычислительная машина.

Это означает, что само развитие вычислительной техники невозможно без использования результатов, полученных в программировании, искусственном интеллекте и других разделах, составляющих информатику. Даже проектирование современных ЭВМ и разработка их элементной базы требуют специальных систем автоматизированного проектирования - САПР, созданием которых занимаются специалисты, работающие в области информатики.

Научное направление, своим появлением обязанное вычислительным машинам - это программирование, цель которого разработать средства для подготовки задач к решению на ЭВМ и создать средства программного обеспечения, с помощью которых реализуются вычислительный процесс на ЭВМ и обмен информацией с внешним миром.

В начальный период своего развития программирование не имело под собой прочной теоретической базы и напоминало труд ремесленников высшей квалификации, когда качество работы определяется не знаниями, а профессиональным умением. С накоплением опыта программирования определились общие идеи и положения, лежащие в основе построения программ для компьютеров и в самих процедурах программирования. Это повлекло за собой создание теоретического программирования, в котором выделяется несколько направлений.

Одно из них связано с созданием разнообразных языков программирования. Кроме разработки языка, на котором пользователь записывает программы, необходимы специальные средства, обеспечивающие автоматический перевод записи программы в форму, воспринимаемую компьютером. Это делается с помощью специальных программных систем - трансляторов, созданием которых также занимаются системные программисты.

Другая область деятельности системных программистов - создание операционных систем, без которых не может функционировать никакая вычислительная машина.

Тенденцией последних десятилетий стал переход от отдельных вычислительных машин к объединениям многих разнотипных машин в единую сеть сбора, обработки и передачи данных. Для того чтобы различные компьютеры “понимали” сообщения друг друга, нужны специальные языки, называемые протоколами связи. Это также область деятельности системных программистов.

Кроме системного выделяют проблемно-ориентированное программирование. Специалисты в этой области создают пользовательские программы, нацеленные на решение задач в той или иной области человеческой деятельности. Эти же программисты создают специальные пакеты прикладных программ, являющиеся удобным средством для пользователя, работающего в фиксированной предметной области.

Большой отряд программистов связан с созданием программ для разного рода информационных систем, например для банков данных.

Одним из наиболее молодых направление информатики является искусственный интеллект, возникшее в начале 70-х годов 20-го века.

Основная цель работ в области искусственного интеллекта - стремление проникнуть в тайны творческой деятельности людей и реализовать их подобие в искусственных системах.

Искусственный интеллект появился на базе вычислительной техники, математической логики, программирования, психологии, лингвистики, нейрофизиологии и других областей знаний.

Оказалось, что с появлением ЭВМ стало возможным решать не только задачи вычислительного характера, но и различные головоломки, логические задачи, играть в шахматы, создавать игровые программы, сочинять музыкальные мелодии, стихи, сказки, переводить с одного языка на другой, распознавать образы, доказывать теоремы и т.д.

Существует несколько основных проблем, изучаемых в искусственном интеллекте: представление знаний; моделирование рассуждений; диалоговые процедуры общения на естественном языке; планирование целесообразной деятельности; обучение интеллектуальных систем в процессе их деятельности.

Интеллектуальные системы уже внедряются в практику человеческой деятельности. Это экспертные системы, интеллектуальные информационные системы, интеллектуальные работы.

Информационная система - это хранилище информации, снабженное процедурами ввода, поиска, размещения и выдачи информации.

При их создании решаются следующие задачи:

- анализ и прогнозирование потоков разнообразной информации, перемещающихся в обществе;

- исследование способов представления и хранения информации, создание специальных языков для формального описания информации различной природы, разработка специальных приемов сжатия и кодирования информации, аннотирование объемных документов и реферирование их;

- построение различных процедур и технических средств для их реализации, с помощью которых можно автоматизировать процесс извлечения информации из документов, не предназначенных для вычислительных машин, а ориентированных на восприятие их человеком;

- создание информационно-поисковых систем, способных воспринимать запросы к информационным хранилищам, сформулированные на естественном человеческом языке, а также специальных языках запросов для систем такого типа;

- создание сетей хранения, обработки и передачи информации, в состав которых входят информационные банки данных, терминалы, обрабатывающие центры и средства связи.

Большое прикладное значение имеет изучение информационных процессов, протекающих в биологических системах, использование накопленных знаний при организации и управлении природными системами и создание технических систем. В эту ветвь информатики входят три самостоятельные науки:

- биокибернетика, решающая проблемы, связанные с анализом информационно-управляющих процессов, протекающих в живых организмах, с диагностикой заболеваний и поиском путей их лечения и созданием соответствующих систем;

- бионика, занимающаяся использованием принципов работы живых систем в искусственных объектах;

- биогеоценология, нацеленная на решение проблем, относящихся к системно-информационным моделям поддержания и сохранения равновесия природных систем и поиска таких воздействий на них, которые стабилизируют разрушающие воздействия человеческой цивилизации на биомассу Земли.

Мир находится сейчас на пороге информационного общества. В этом обществе огромную роль будут играть системы распространения, хранения и обработки информации. Со временем, подобно мировой системе связи, возникнет единая информационная среда, которая обеспечит любому человеку доступ ко всей нужной для него информации. Широкое внедрение компьютеров во все среды человеческой деятельности наряду с использованием интеллектуальных роботов коренным образом изменили традиционную среду обитания людей. Растет количество людей, профессионально занятых сбором, накоплением, распространением и хранением информации. Информация становится товаром, имеющим большую ценность.

Перспективы перехода к информационному обществу вызывают много проблем социального, правового, технического характера. Например, применение роботов на производстве приведет к полному изменению технологии, которая в наши дни ориентирована на участие в ней человека. Резко изменится подготовка членов нового общества к самостоятельной жизни. Уже начаты поисковые работы в области создания новых форм обучения, которые заменят существующие традиционные формы. Полностью изменится номенклатура профессий, специальностей и способов организации труда.

Все эти проблемы составляют объект исследования тех психологов, социологов, философов и юристов, которые работают в области информатики. Создаются автоматизированные обучающие системы (АОС), автоматизированные рабочие места (АРМ) для специалистов различного профиля, распределяемые банковские системы и многие другие, чье функционирование опирается на использование всего арсенала информатики.

В более узком смысле информатику понимают как базовую учебную дисциплину, охватывающую основные вопросы по изучению технических, программных и алгоритмических средств организации современных ИС и формирующую у обучаемого определенный кругозор, объем знаний, уровень алгоритмического мышления, а также практические навыки работы с конкретными программными системами, необходимыми для его дальнейшего обучения по применению ИС в определенных областях человеческой деятельности.

Определение информации

Понятие информации является центральным понятием информатики, объектом ее исследования. Существует несколько определений информации.

Информация является всеобщим свойством материи и носит атрибутивный характер так же, как и пространство, время и движение. Потому наиболее общим является следующее определение: информацияявляется отраженным разнообразием, т.е. разнообразием, которое один объект содержит о другом в процессе их взаимодействия. Причем информация рассматривается также и как разнообразие, которое объект в результате самоотражения содержит в самом себе.

В информатике же принято следующее определение семантической информации: информация - это содержание сообщения, сигнала, памяти, а также сведения, содержащиеся в сообщении, сигнале, памяти.

Информационные процессы, т.е. процессы передачи, хранения и переработки информации, всегда играли важную роль в жизни общества. Люди обмениваются устными сообщениями, записками, посланиями. Они передают друг другу просьбы, приказы, ответы о проделанной работе, описи имущества; публикуют рекламные объявления и научные статьи; хранят старые письма и документы; долго размышляют над полученными известиями или немедленно кидаются выполнять указания начальства. Все это - информационные процессы.

Представление информации

Информация всегда связана с материальным носителем, а ее передача - с затратами энергии. Однако одну и ту же информацию можно хранить в различном материальном виде (на бумаге, в виде фотонегатива, на магнитной ленте и т.д.) и передавать с различными энергетическими затратами (по почте, по телефону, с курьером и т.д.), причем последствия - в том числе и материальные - переданной информации совершенно не зависят от физических затрат на ее передачу, т.е. от природы сигнала. Например, нажатие кнопки опускает тяжелый театральный занавес или взрывает большое здание, красный свет светофора останавливает поезд, а неожиданное неприятное известие может вызвать инфаркт. Поэтому информационные процессы не сводимы к физическим, и информация, наряду с веществом и энергией, является одной из фундаментальных сущностей окружающего нас мира.

При любых видах работы с информацией всегда идет речь о ее представлении в виде определенных символических структур. Наиболее распространены одномерные представления информации, при которых сообщения имеют вид последовательностей символов. Так, информация представляется в письменных текстах, при передаче по каналам связи, в памяти ЭВМ. Однако широко используются и многомерные представления информации, причем под многомерностью понимают не только расположение элементов информации на плоскости или в пространстве (в виде рисунков, схем, графов, объемных макетов и т.д.), но и множественность признаков используемых символов. Например, информацию могут нести не только значения букв и цифр, но и их цвет, размер, вид шрифта.

Количество информации

Количеством информации называется степень уменьшения неопределенности после выбора (получения) сообщения в виде некоторого сигнала.

Например, если студент, первый подошедший к столу экзаменатора, тянет билет из 25 билетов, лежащих на столе, то вероятность p (возможность) того, что он вытащит билет с заданным номером равна 1/25 (одна возможность из 25), т.е. р = 1/25. После выбора билета неопределенности уже нет. Таким образом, число 25 можно было бы считать количеством информации, заложенным в одном выборе из 25 возможностей. Однако такое представление не является достаточно удобным, поскольку число возможностей в различных физических процессах может отличаться на много порядков. Р.Хартли предложил в качестве меры неопределенности логарифм от числа возможностей

где k - коэффициент пропорциональности; m - число возможных выборов;

а - основание логарифма. При k = 1 и а = 2 стандартной единицей количества информации будет выбор их двух возможностей. Такая единица носит наименование бита и может быть представлена одним символом двоичного алфавита, обычно 0 или 1.

Количество информации определяется как разность неопределенности до получения сообщения и после. Если после получения сообщения неопределенность устраняется полностью, то формулы для определения количества информации и неопределенности совпадают.

Клод Шеннон обобщил формулу неопределенности на случай, когда Н зависит не только от m, но и от вероятностей выбора символов и вероятностей связи между ними.

Так, для количества сообщенной или индивидуальной информации он предложил соотношение

где Рi - вероятность выбора i-го символа алфавита.

Удобнее в качестве количества информации пользоваться не значением hi, а средним значением количества информации, приходящейся на один символ алфавита:

Для непрерывного сигнала эта формула приобретает вид:

где p(x) - плотность распределения вероятности.

Контрольные задания

1.1. Дайте определение информатики как базовой учебной дисциплины.

1.2. Определите структуру дисциплины информатики и ее основные задачи.

1.3. Если область экрана имеет размеры 512x128 точек и каждая точка может иметь один из 256 оттенков, то каков минимальный объем памяти (Кбайт), необходимый для хранения этой области.

1.4. Дайте характеристику основных научных направлений, входящих в информатику.

1.5. Определить число бит, необходимых для записи числа 812.

1.6. Дайте определение понятия информации.

1.7. Сколько бит информации требуется для хранения в памяти ЭВМ слова ИНФОРМАТИКА?

1.8. Каковы формы представления информации?

1.9. Дайте определение понятия количества информации.

1.10. Приведите основные формулы для определения количества информации и поясните их смысл.