هر کاراکتر در کامپیوتر با عددی مشخص می شود که آن عدد همان کد کاراکتر است. در اصل کامپیوتر کاراکتر ها را فقط با عدد آن ها می شناسد و نمی داند مثلا حرف "a" چیست. بلکه می داند عدد آن 97 است. جالب تر این که کامپیوتر حتی همین 97 را هم نمی شناسد و با اعداد دودویی آن را تشخیص می دهد.
کد کاراکتر چیست؟
تمام کاراکتر هایی که ما استفاده می کنیم ، در جدول هایی بسیار بزرگ جمع آوری شده اند و به صورت قراردادی این کد ها به آن ها تعلق گرفته است که وقتی ما صفحه ای پر از کاراکتر را می بینیم ، کامپیوتر برای نمایش تمام این کاراکتر ها از آن جدول ها استفاده می کند. سیستم ها به طور پیشفرض از جدول ascii برای نمایش کاراکتر ها استفاده می کنند که جدول بسیار محدودی است و بسیاری از کاراکتر هایی که شاید به درد ما بخورند ، از جمله حروف فارسی را ندارند. اگر شما می توانید الان این حروف فارسی را ببینید به خاطر این است که کامپیوتر شما از جدولی به غیر از این جدول استفاده کرده است. جدول utf-8 جدولی کامل تر است که به دلیل استفاده از اعداد در مبنای 16 ، ظرفیت بسیار بیشتری دارد. این جدول شامل حروف فارسی و بسیاری کاراکتر های دیگر نیز هست.