Merge pull request #4324 from FernetMenta/wasapi
[vuplus_xbmc] / lib / enca / TODO
1 #============================================================================
2 # Enca v1.12 (2009-10-29)  guess and convert encoding of text files
3 # Copyright (C) 2000-2003 David Necas (Yeti) <yeti@physics.muni.cz>
4 # Copyright (C) 2009 Michal Cihar <michal@cihar.com>
5 #============================================================================
6
7 TO THE NEXT RELEASE:
8 (this list must be empty at the time of release)
9
10 IN FUTURE:
11 (should be done, but maybe not right now)
12
13 * LCUC check for cyrillic charsets.
14 * Backups -- like cp, mv, etc.  This will be hard to get right with all the
15   silly converters.
16 * More tests
17 * Structured documentation (the manual page is ugly)
18   - keep a reasonably brief manual page
19   - put all the boring doc stuff somewhere else, there are possibilities:
20     info: searchable, has links, partly portable, has console viewers
21     HTML: poorly searchable, has links, most portable, has console viewers
22     TeX (ps): not searchable, no links, portable, most pleasant to read,
23           no console viewers
24     => use SGML (or info itself?) and generate the others
25
26
27 MAYBE SOMEDAY:
28 (when I will have mood for it, items are freely moved here and removed again)
29
30 * Detect all-caps texts OK.
31   After several experiments it seems we have to
32   - use pair occurences, at least, with specificaly computed
33     difference-maximising weights
34   - guess in two steps
35   - first with uncapitalization and pair weights, and check whether the
36     sample looks like natural text (garbageness test, but better)
37   - if the first approach fails, do it as we do it now
38 * design better levels of verbosity/warnings (or: remove the --verbose option,
39   keep important messages and remove all others?)
40   0: only messages followed by exit(EXIT_FAILURE) (or abort()) are printed
41      plus `cannot convert...'
42   1: all nonfatal errors/warnings
43   2: what converters are tried, what language gets detected (do not duplicate
44      --details)
45   >2: debug
46 * _real_ paranoiac behaviour assuring that nothing gets lost and that
47   conversion output is either correctly converted text or untouched original
48   (requires major redesign of all the conversion stuff)
49
50
51 NEVER:
52 (you can do anything GNU GPL v2 allows, but I'll restrain)
53
54 * features that nobody needs (mm, well, ... ok, let it be)
55 * duplicate other tools functionality more than necessary, use them instead
56 * dependency on anything that is not ISO C and/or POSIX (moreover do not use
57   braindead features of both); important functionallity must be present
58   everywhere nevertheless, enca can be smaller, faster or cleverer on some
59   (GNU) systems
60 * localization; please correct my english instead ;->
61 * converter calling generalization (would require inlcuding the whole wordexp
62   thing in enca, and: launching external converter is Bad Thing(TM) anyway)
63 * data in run-time files (needs parser (could live with) and disallows hooks
64   (can't live without))
65 * loadable module support (it's not very portable)
66 -------------
67
68
69 KNOWN ISO C CONFLICTS:
70 (perhaps to be solved someday)
71
72 All constants and typedefs.  They start with ENCA_ and Enca, but:
73
74   Names beginning with a capital `E' followed a digit or uppercase
75   letter may be used for additional error code names.               [errno.h]
76
77 And additionally inside libenca (i.e. not so serious):
78 * libenca.h: #define EPSILON                                        [errno.h]
79 * filters.c: isvbox[]                                               [ctype.h]
80 * guess.c: #define isbinary                                         [ctype.h]
81 * guess.c: #define istext                                           [ctype.h]
82 * multibyte.c: is_valid_utf7()                                      [ctype.h]
83 * multibyte.c: is_valid_utf8()                                      [ctype.h]
84
85 Some probably can't conflict.
86