it-swarm-id.com

Bagaimana saya bisa mengedit teks Unicode di Notepad ++?

Terkadang saya mengedit teks bahasa Inggris yang menyertakan karakter Unicode. Untuk beberapa alasan, pada PC saya, Notepad ++ mengkonversi karakter Unicode ke ??? dengan demikian merusak teks dan kehilangan semua data itu. Saya mencari cara untuk mengedit teks seperti itu, sambil mempertahankan karakter Unicode. Saya menggunakan Consolas sebagai Font saya. Jika font tidak memiliki semua karakter itu, mengapa saya harus kehilangan data ketika saya menyalin teks dari Notepad ++ (melalui clipboard Windows)?

25
Robinicks

Jika file tersebut benar-benar dikodekan dalam Unicode, Notepad ++ akan mendeteksi secara otomatis. The font Consolas bekerja dengan baik untuk saya. Anda dapat mencoba salah satu dari dua opsi menu ini:

  • Pengkodean -> Encode di UTF-8
  • Pengkodean -> Konversikan ke UTF-8

Saya cukup yakin yang pertama akan melakukan apa yang Anda inginkan.

14
DisgruntledGoat

Masalah yang dijelaskan dalam pertanyaan terjadi ketika dokumen kosong/baru diatur ke "ANSI", dan nicode karakter disisipkan ke dalamnya.

Tidak ada deteksi otomatis saat digunakan dengan dokumen kosong/baru, setidaknya tidak dalam versi Notepad ++ yang saya uji. "ANSI" adalah default di Notepad ++ untuk dokumen baru kecuali ditetapkan dalam menu Pengaturan -> Preferensi -> tab Dokumen Baru/Buka Simpan Direktori .

Solusi

Solusinya adalah dengan mengatur pengkodean ke TF-8 sebelum menempel, menu Format -> Encode dalam UTF-8 :

Menu command "menu Format/Encode in UTF-8" about to be executed

Contoh

Saya menyalin beberapa teks ke dokumen Notepad ++ baru, Bahasa Rusia (русский язык, russkiy yazyk) , dari Firefox yang menampilkan halaman Wikipedia bahasa Rusia.

Jika penyandian tidak diubah dari "ANSI" ini hasilnya:

Result of pasting the Unicode string "Russian (русский язык, russkiy yazyk" into a new Notepad++ document without changing the encoding from the default "ANSI".

Jika penyandian diubah ini hasilnya:

Result of pasting the Unicode string "Russian (русский язык, russkiy yazyk" into a new Notepad++ document after changing the encoding from the default "ANSI" to "UTF-8".

Seperti dapat dilihat pada gambar di bawah ini (bagian Cyrillic disorot), Notepad ++ sebenarnya mengubah karakter Unicode menjadi ASCII 63 (hex 3F), tanda tanya. Itulah sebabnya karakter Unicode hilang (dalam mode "ANSI" ) saat menyalin teks melalui clipboard (itu adalah bukan masalah font - informasi hilang).

Screenshot of a hex view of said document

Diuji pada: Notepad ++ v5.4.5 (UNICODE).

14
Peter Mortensen

Ada kabar baik dan kabar buruk.

Kabar baik: Notepad ++ mendukung Unicode (setidaknya dari apa yang bisa saya kumpulkan).

Berita buruk: Rupanya dukungan Unicode hanya pada Windows XP.

Sebenarnya saya tidak punya mesin Windows di depan saya. Dari yang saya ingat, ada menu Encoding di bawah menu Format di suatu tempat. Pengkodean untuk Unicode sebenarnya paling umum adalah UTF-8.

Ini adalah gambar 'cantik' dari dukungan Unicode di Notepad ++,

enter image description here

5
Josh Hunt

Unicode berfungsi dengan baik di Windows 7. Satu-satunya masalah yang muncul adalah Anda harus mengetik ulang karakter yang telah diubah. Itu terjadi pada saya. Saya menulis dengan huruf Skandinavia jadi ä -> E4, ö -> F6. Ini adalah rasa sakit di pantat untuk menggantikan mereka semua, tapi itu sepadan.

Jika Anda menyandikan halaman dari ANSI -> UTF-8 maka akan ada beberapa masalah karakter.

Saya menyarankan agar Anda membuat halaman baru di UTF-8 dan kemudian menyalin/menempelkan informasi Anda. Tidak akan/seharusnya tidak ada masalah saat itu.

3
Sloshed

Ini bekerja untuk saya:

Saya mengubah font menjadi Courier New di konfigurator gaya pada PC saya (Windows 7 dengan set karakter Bahasa Inggris/AS dan bahasa Rumania untuk set non-Unicode). Ini bekerja dengan font Courier New & Tahoma + encoding UTF-8.

1
rapy rapy

Pada menu atas pilih Encoding kemudian pilih Encode in UTF-8 atau Encode in UTF-8 Without BOM maka Anda dapat mengedit teks dalam pengkodean Unicode.

0
Siavash