Trieda Character vo všeobecnosti zabaľuje hodnotu všetkých primitívnych typov char do objektu. Každý objekt typu Znak môže obsahovať jedno pole, ktorého typ je char.
Všetky polia, metódy a konštruktory triedy Character sú špecifikované dátovým súborom Unicode, ktorý je najmä súčasťou databázy znakov Unicode a spravuje ho Unicode Consortium.
Súbor znakov v rozsahu od U+0000 do U+FFFF je niekedy známy ako základná viacjazyčná rovina (t.j. BMP). Znaky, ktorých kódové body sú väčšie ako U+FFFF, sú známe ako doplnkové znaky. Jazyk Java vo všeobecnosti používa metódu kódovania UTF-16 na reprezentáciu polí znakov v reťazci alebo vyrovnávacej pamäti reťazcov. V tomto type znázornenia sú doplnkové znaky reprezentované ako dvojica znakov, pričom prvý je z rozsahu s vysokým zástupným znakom (uD800-uDBFF) a druhý z rozsahu s nízkym zástupným znakom (uDc00- uDBFF).
Metódy
Metóda | Popis |
---|---|
charCount(int codePoint) | Určuje počet hodnôt znakov, ktoré sú potrebné na vyjadrenie daného znaku. |
charValue() | Vráti hodnotu daného objektu Character. |
codePointAt(char[]a, int index) | Vráti codePoint pre zadaný index daného poľa. |
codePointAt(char[]a, int index, int limit ) | Vráti kódový bod poľa znakov na zadanom indexe, pričom sa použijú iba prvky poľa s indexom menším ako zadaný limit. |
codePointAt(sekvencia znakov, int index) | Vráti kódový bod na zadanom indexe pre danú sekvenciu znakov. |
codePointBefore(char[]a, int index) | Vráti codePoint pre dané pole v predchádzajúcom indexe. |
codePointBefore(char[]a, int index, int start) | Vráti kódový bod pre dané pole v predchádzajúcom indexe, kde sú použité iba prvky poľa s indexom väčším alebo rovným začiatku. |
codePointBefore(CharSequence, int index) | Vráti CodePoint pre danú CharSequence v predchádzajúcom indexe. |
codePointCount(char[]a, int offset, int count) | Vráti celkový počet kódových bodov Unicode v danom podpole argumentu poľa char. |
codePointCount(CharSequence seq, int beginIndex, int endIndex) | Vráti počet kódových bodov Unicode poskytnutých v danom rozsahu textu pre zadanú sekvenciu znakov. |
codePointOf(názov reťazca) | Vráti hodnotu codePoint pre daný znak Unicode určený názvom konkrétneho znaku. |
porovnať (znak x, znak y) | Porovnáva dve hodnoty typu znakov numericky. |
porovnať s (iný znak) | Číselne porovná dva objekty typu Character. |
číslica (char ch, int radix) | Vráti číselnú hodnotu pre daný znak v zadanom indexe. |
číslica (int codePoint, int radix) | Vráti číselnú hodnotu pre daný znak v zadanom radixe. |
rovná sa (objekt objektu) | Porovná daný objekt so zadaným objektom. |
forDigit(int digit, int radix) | Určuje zobrazenie znaku pre konkrétnu číslicu v danom radixe. |
getDirectionality(char ch) | Vráti vlastnosť smerovosti Unicode pre zadaný znak. |
getDirectionality(int codePoint) | Vráti vlastnosť smerovania Unicode pre zadaný codePoint. |
getName(int codePoint) | Vráti názov Unicode pre daný codePoint alebo môže vrátiť hodnotu null, ak codePoint nie je priradený. |
getNumericValue(char ch) | Vráti hodnotu typu celého čísla zadaného znaku Unicode. |
getNumericValue(int codePoint) | Vráti hodnotu typu celé číslo zadaného kódu Unicode. |
getType (char ch) | Vráti hodnotu, ktorá označuje všeobecnú kategóriu znaku. |
getType(int codePoint) | Vráti hodnotu, ktorá označuje všeobecnú kategóriu znaku. |
hashcode() | Vráti hash kód pre zadaný znak. Táto metóda sa rovná výsledku vyvolania metódy charValue(). |
hashcode (hodnota znaku) | Vráti hašovací kód pre konkrétnu hodnotu znaku. |
highSurrogate(int codePoint) | Vráti počiatočný náhradný kódový bod konkrétneho náhradného páru, ktorý predstavuje doplnkový znak v kódovaní UTF-16. |
isAlphabetic(int codePoint) | Určuje, či daný znak je abeceda alebo nie. |
isBmpCodePoint(int codePoint) | Určuje, či je daný znak v Základnej viacjazyčnej rovine alebo nie. |
isDefined(char ch) | Určuje, či je znak definovaný v Unicode alebo nie. |
isDefined(int codePoint) | Určuje, či je znak (bod v kóde Unicode) definovaný v kóde Unicode alebo nie. |
isDigit(char ch) | Určuje, či daný znak je číslica alebo nie. |
isDigit(int codePoint) | Určuje, či daný znak (bod v kóde Unicode) je číslica alebo nie. |
isHighSurrogate (char ch) | Určuje, či dané hodnoty znakov sú alebo nie sú bodom vysokého náhradného kódu Unicode. |
isIndentifierIgnorable(char ch) | Určuje, či je daný znak považovaný za ignorovateľný znak v identifikátore Java alebo nie. |
isIndentifierIgnorable(int codePoint) | Určuje, či sa daný znak (Unicode codePoint) považuje za ignorovateľný znak v identifikátore Java alebo nie. |
isIdeographic(int codePoint) | Určuje, či je zadaný znak CJKV (čínsky, japonský, kórejský a vietnamský) ideograf alebo nie. |
isISOControl(char ch) | Určuje, či daný znak je alebo nie je riadiacim znakom ISO. |
isISOControl(int codePoint) | Určuje, či daný znak (bod kódu Unicode) je alebo nie je riadiacim znakom ISO. |
isJavaIdentifierPart(char ch) | Určuje, či daný znak je súčasťou iného identifikátora Java ako prvý znak alebo nie. |
isJavaIdentifierPart(int codePoint) | Určuje, či daný znak (bod kódu Unicode) je súčasťou identifikátora Java iného ako prvý znak alebo nie. |
isJavaIdentifierStart(char ch) | Určuje, či je daný znak prípustný ako prvý znak v identifikátore Java alebo nie. |
isJavaIdentifierStart(int codePoint) | Určuje, či daný znak (bod v kóde Unicode je povolený ako prvý znak v identifikátore Java alebo nie. |
isJavaLetter(char ch) | Nahradený znakom isJavaIdentifierStart(char). |
isJavaLetterOrDigit(int codePoint) | Nahradený isJavaIdentifierPart(char). |
isLetter(char ch) | Určuje, či zadaný znak je písmeno alebo nie. |
isLetter(int codePoint) | Určuje, či zadaný znak (bod v kóde Unicode) je písmeno alebo nie. |
isLetterOrDigit(char ch) | Určuje, či zadaný znak je písmeno alebo číslica alebo nie. |
isLetterOrDigit(int codePoint) | Určuje, či zadaný znak (bod v kóde Unicode) je písmeno alebo číslica alebo nie. |
isLowerCase(char ch) | Určuje, či je zadaný znak malé písmeno alebo nie. |
isLowerCase(int codePoint) | Určuje, či je zadaný znak (bod v kóde Unicode) malé písmeno alebo nie. |
isLowSurrogate(char ch) | Určuje, či je daná hodnota znaku jednotkou Unicode s nízkym zástupným kódom alebo nie. |
isMirrored(char ch) | Určuje, či je postava zrkadlová alebo nie. |
isMirrored(int codePoint) | Určuje, či je znak (bod kódu Unicode) zrkadlený alebo nie. |
isSpace(char ch) | Nahradené metódou isWhiteSpace(char ch). |
isSpaceChar(char ch) | Určuje, či zadaný znak je znak medzery Unicode alebo nie. |
isSupplementaryCodePoint(int codePoint) | Určuje, či je daný znak (bod v kóde Unicode) v rozsahu doplnkových znakov alebo nie. |
isSurrogate(char ch) | Určuje, či je daná hodnota znaku jednotkou náhradného kódu Unicode. |
isSurrogatePair (vysoký počet znakov, nízky počet znakov) | Určuje, či daný pár hodnôt char je platným náhradným párom Unicode alebo nie. |
isTitleCase(char ch) | Určuje, či daný znak je alebo nie je titulný znak. |
isTitleCase(int codePoint) | Určuje, či daný znak (bod v kóde Unicode) je alebo nie je znak veľkosti nadpisu. |
isUnicodeIdentifierPart(char ch) | Určuje, či je daný znak súčasťou Unicode identifikátora alebo nie. |
isUnicodeIdentifierPart(int codePoint) | Určuje, či daný znak (bod kódu unicofde) je súčasťou identifikátora Unicode alebo nie. |
isUnicodeIdentifierStart(char ch) | Určuje, či je daný znak prípustný ako prvý znak v identifikátore Unicode alebo nie. |
isUnicodeIdentifierStart(int codePoint) | Určuje, či je daný znak (bod v kóde Unicode) povolený ako prvý znak v identifikátore Unicode alebo nie. |
isUpperCase(char ch) | Určuje, či daný znak je veľký alebo nie. |
isUpperCase(int codePoint) | Určuje, či daný znak (bod v kóde Unicode) je veľké písmeno alebo nie. |
isValidCodePoint(int codePoint) | Určuje, či je daný znak platnou bodovou hodnotou kódu Unicode alebo nie. |
isWhitespace(char ch) | Určuje, či daný znak je medzera alebo nie. |
isWhitespace(int codePoint) | Určuje, či daný znak (bod v kóde Unicode) je prázdny znak alebo nie. |
lowSurrogate(int codePoint) | Vráti jednotku nízkeho náhradného kódu (t. j. koncový náhradný kód) náhradného páru, ktorý predstavuje doplnkový znak v kódovaní UTF-16. |
offsetByCodePoints(char[]a, int začiatok, int počet, int index, int codePointOffset) | Vráti index pre dané podpole znakov, čo je posun od daného indexu o body kódu codePointOffset. |
offsetByCodePoints(CharSequence seq, int index, int codePointOffset) | Vráti index pre dané podpole znakov, čo je posun od daného indexu o body kódu codePointOffset. |
reverseBytes (char ch) | Vráti hodnotu získanú obrátením poradia daných bajtov v zadaných hodnotách znakov. |
toChars(int codePoint) | Konvertuje zadaný znak (bod kódu Unicode) na jeho UTF-16 reprezentáciu, ktorá je uložená v poli znakov. |
toChars(int codePoint, char[] dst, int dstIndex) | Skonvertuje zadaný znak (bod v kóde Unicode) na jeho reprezentáciu UTF-16. |
toCodePoint (vysoký počet znakov, nízky počet znakov) | Skonvertuje daný náhradný pár na zodpovedajúcu bodovú hodnotu doplnkového kódu. |
na malé písmená (char ch) | Konvertuje argument typu znaku na malé písmená pomocou informácií o mapovaní veľkých a malých písmen získaných z dátového súboru Unicode. |
toLowerCase(int codePoint) | Konvertuje argument typu znaku (bod v kóde Unicode) na malé písmená pomocou informácií o mapovaní veľkých a malých písmen získaných z dátového súboru Unicode. |
natiahnuť() | Vráti objekt typu String, ktorý predstavuje hodnotu znaku. |
toString(char ch) | Vráti objekt typu String, ktorý predstavuje zadaný znak |
toTitleCase(char ch) | Konvertuje argument typu znaku na titlecase pomocou informácií o mapovaní veľkých a malých písmen získaných z dátového súboru Unicode. |
toTitleCase(int codePoint) | Konvertuje argument typu znaku (bod v kóde Unicode) na malé písmená pomocou informácií o mapovaní veľkých a malých písmen získaných z dátového súboru Unicode. |
veľké písmená (char ch) | Konvertuje argument typu znaku na veľké písmená pomocou informácií o mapovaní veľkých a malých písmen získaných z dátového súboru Unicode. |
toUpperCase(int codePoint) | Konvertuje argument typu znaku (bod v kóde Unicode) na veľké písmená pomocou informácií o mapovaní veľkých a malých písmen získaných z dátového súboru Unicode. |
valueOf(char c) | Vráti inštanciu znaku, ktorý predstavuje zadanú hodnotu znaku. |
Príklad 1
import java.util.Scanner; public class JavaCharacterExample1 { public static void main(String[] args) { // Ask the user for the first input. System.out.print('Enter the first input:'); // Use the Scanner class to get the user input. Scanner scanner = new Scanner(System.in); // Gets the user input. char[] value1 = scanner.nextLine().toCharArray(); int result1 = 0; // Count the characters for a specific character. for (char ch1 : value1) { result1 = Character.charCount(ch1); } // Print the result. System.out.print('The value comes to: '+result1+' '); System.out.print('Enter the second input:'); char[] value2 = scanner.nextLine().toCharArray(); for (char ch2 : value2) { int result2 = Character.hashCode(ch2); System.out.print('The hash code for the character ''+ch2+'' is given as:'+result2+' '); } System.out.print('Enter the third input:'); char[] value3 = scanner.nextLine().toCharArray(); for (char ch3 : value3) { boolean result3 = Character.isDigit(ch3); if(result3){ System.out.println('The character '' + ch3 + '' is a digit. '); } else{ System.out.println('The character '' + ch3 + '' is not a digit.'); } System.out.print('Enter the fourth input:'); char[] value4 = scanner.nextLine().toCharArray(); for (char ch4 : value4) { boolean result4 = Character.isISOControl(ch4); System.out.println('The fourth character ''+ch4+'' is an ISO Control:'+result4); } } } }
Výkon:
Enter the first input:89 The value comes to: 1 Enter the second input:J The hash code for the character 'J' is given as:74 Enter the third input:5 The character '5' is a digit. Enter the fourth input:h The fourth character 'h' is an ISO Control:false
Príklad 2
public class JavaCharacterExample2{ public static void main(String[] args) { // Create four char primitives ch1, ch2, ch3 and ch4. char ch1, ch2, ch3, ch4; // Assign the values to ch1, ch2, ch3 and ch4. ch1 = 'T'; ch2 = 'k'; ch3 = ' '; ch4 = 'G'; // Create four boolean primitives b1, b2, b3 and b4. boolean b1, b2, b3,b4; // Assign the results to b1, b2, b3 and b4. b1 = Character.isLetter(ch1); b2 = Character.isLowerCase(ch2); b3 = Character.isSpace(ch3); b4 = Character.isDefined(ch3); String str1 = ' The first character is a letter: ' + b1; String str2 = ' The second character is a lower-case: ' + b2; String str3 = ' The third character is for space: ' + b3; String str4 = ' The fourth character is defined in Java identifier: ' + b3; // Print the values of b1, b2, b3 and b4. System.out.println( str1 ); System.out.println( str2 ); System.out.println( str3 ); System.out.println( str3 ); } }Vyskúšajte to
Výkon:
The first character is a letter: true The second character is a lower-case: true The third character has a space: true The third character has a space: true