программирование на языке бейсик

 

УРОК 6. Символьное представление информации

Символы не являются, конечно, системами счисления, описанные в предыдущих уроках. Для того, чтобы закончить рассмотрение основных видов данных, коснемся и этого вопроса. Конечно, существуют и другие виды данных, например, структуры и записи, но они являются комбинацией вышеперечисленных.

Символы. При передаче информации по телетайпу в начале века использовались наборы из шести или семи бит (26 =64, 27 = 128), которые представляли символы. Так, в шестибитовом наборе можно использовать набор, состоящий из шестидесяти четырех символов, куда должны войти буквы, десять цифр, знаки пунктуации и управляющие символы (например, начало и конец передачи данных). Естественно, что при этом нельзя передавать прописные (большие) и строчные (маленькие) символы, так как для них не хватит места в таблице.

При семибитовом наборе уже можно ввести разделение на прописные (большие) и строчные (маленькие) символы, например «а» и «А», ввести дополнительные управляющие символы.

В больших машинах 360 серии, выпускаемых фирмой IBM с шестидесятых годов символ представляется группой из восьми бит, которые называются байтом. Это так называемое символьное представление, основы которого были использованы в дальнейшем при разработке программного обеспечения для персональных компьютеров.

Существует понятие цепочки символов, в которой имеется несколько символов, следующих друг за другом, например, «лгар2». Она может иметь в своем начале число, в котором находится значение числа символов или оканчиваться специальным символом, который обозначает конец цепочки.

Символьные константы обычно заключаются в кавычки, например, «Москва», «МОСКВА», «мОсква», «Первая программа», « 3+4=7» и так далее. Все перечисленные символьные константы являются разными, так как большие и маленькие символы имеют разный код. В примере « 3+4=7» вычисления операции сложения не происходит, так как данные символы воспринимаются программой как символы, а не как цифры.

Символьная информация будет находиться в памяти в той же последовательности, как она и введена. Если имеется последовательность «0123», то в оперативной памяти будет вначале находиться символ «0», потом «1», затем «2» и оканчиваться символом «3».

Символы могут кодироваться по определенному правилу, и существует несколько таблиц, определяющих числовой код символа. Существует таблица ASCII, которая используется в персональном компьютере, EBCDIC - коды которых использовались в больших и некоторых видах персональных компьютеров, нежели IBM-совместимых, появилась Unicode – новая система кодирования для системы Windows. Кроме того, нужно учитывать, что в системах Windows и ДОС используются разные таблицы представления символов.

Первые коды ASCII были созданы для работы на телетайпе и имели семибитную длину, то есть в таблице имелось 128 символов. Фирма IBM развила код, увеличив его до восьми бит (256 символов), причем для первых управляющих символов были придуманы графические значки, которые можно увидеть на экране дисплея при просмотре. В данный набор были добавлены символы псевдографики для прорисовки таблиц. Когда вы работаете с программой Norton Commander в ДОС, то видите в окнах рамку, которая представляется псевдографическими символами. Каждый символ состоит из линии или двух, либо угла или пересечения линий, из которых составляется рамка.

В силу того, что кодовая страница может вместить 256 символов, то понятно, что в эту таблицу могут войти два европейских языка, например, в нашей стране используются английский язык и кириллица. Однако некоторые языки в силу того, что они содержат большое количество разных символов, не смогут войти в данную таблицу, например, китайский или японский. Поэтому в настоящее время разработана новая таблица под названием Unicode, где под один символ выделяется два байта. Таким образом, можно представить 65 536 символов. Данная таблица используется в операционных системах, начиная с Windows 95.

Итак, каждому байту соответствует один символ. Каким образом это происходит? Например, символ «1» имеет значение в цифровой форме 48, «2» - 49 и так далее. Первая такая таблица для компьютера была разработана фирмой IBM и представлена в таблице ?1. Однако, в ней нет русских символов. Поэтому была создана другая таблица, которая используется в нашей стране (табл. ?2). В дальнейшем для системы Windows были созданы другие таблицы (табл. ?3) и для нашей страны (табл. ?4). Как видно, эти таблицы отличаются друг от друга. В дальнейшем мы будем ссылаться на них для того, чтобы объяснить, как это может отразиться на работе программ.

В силу того, что основа представления информации в компьютере происходит на основе бита, то естественно, что используется двоичная и шестнадцатеричная система (степень числа два, 24 = 16).

Так как первоначально процессор работал с числовыми данными, имеющими 8 бит (один байт), то было введено понятие слово, которое было равно 8 битам. Однако с появлением 16-разрядных машин, словом стали называться 16 бит, то есть для хранения данных можно использовать числа от 0 до 216 -1= 65535. Позднее с появлением Pentium стали говорить о 32-разрядном слове, а с выпуском Pentium Pro - 64-разрядном слове. Таким образом, возникла путаница, которая пока не разрешена, поэтому будем считать, что слово состоит из двух байт.

Существует также понятие двойного слова (32 разрядов или имеет размер в два раза большее, чем простое слово) и учетверенного слова (64 разрядов или в четыре раза большее простого слова).

Задачи.

1. При выводе на экран переменной, укажите, что будет выведено: а) «Моя первая программа», б) 3+4, в) «3+4», г) «клавиатура», д) 2*8

2. Напишите кодовое представление для набора символов: а) Windows 2000, б) Москва, в) 2004 год.

(переход на следующую страницу)

 

О↙О↘О↙О↘О↙О↘О↙О↘О↙О↘О↙О↘О↙О↘О↙О↘О











Информация данного сайта предназначена для бесплатного изучения персонального компьютера. Можно копировать, передавать материалы другим лицам.

Запрещается использовать материалы для получения личной финансовой выгоды, а также размещать на сайтах в интернете.


 
 
 
Яндекс.Метрика


Каталог@MAIL.RU - каталог ресурсов интернет