chiark / gitweb /
lint: be more strict about redundant summaries
[fdroidserver.git] / fdroidserver / lint.py
1 #!/usr/bin/env python2
2 # -*- coding: utf-8 -*-
3 #
4 # lint.py - part of the FDroid server tool
5 # Copyright (C) 2013-2014 Daniel Martí <mvdan@mvdan.cc>
6 #
7 # This program is free software: you can redistribute it and/or modify
8 # it under the terms of the GNU Affero General Public License as published by
9 # the Free Software Foundation, either version 3 of the License, or
10 # (at your option) any later version.
11 #
12 # This program is distributed in the hope that it will be useful,
13 # but WITHOUT ANY WARRANTY; without even the implied warranty of
14 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See th
15 # GNU Affero General Public License for more details.
16 #
17 # You should have received a copy of the GNU Affero General Public Licen
18 # along with this program.  If not, see <http://www.gnu.org/licenses/>.
19
20 from optparse import OptionParser
21 import re
22 import logging
23 import common
24 import metadata
25 from collections import Counter
26
27 config = None
28 options = None
29
30 regex_warnings = {
31     'Web Site': [
32         (re.compile(r'.*[^sS]://github\.com/.*'),
33          "github URLs should always use https:// not http://"),
34         # TODO enable in August 2015, when Google Code goes read-only
35         # (re.compile(r'.*://code\.google\.com/.*'),
36         # "code.google.com will be soon switching down, perhaps it moved to github.com?"),
37     ],
38     'Source Code': [
39         (re.compile(r'.*[^sS]://github\.com/.*'),
40          "github URLs should always use https:// (not http://, git://, or git@)"),
41         (re.compile(r'.*[^sS]://dl\.google\.com/.*'),
42          "dl.google.com URLs should always use https:// not http://"),
43         (re.compile(r'.*[^sS]://gitorious\.org/.*'),
44          "gitorious URLs should always use https:// (not http://, git://, or git@)"),
45         # TODO enable in August 2015, when Google Code goes read-only
46         # (re.compile(r'.*://code\.google\.com/.*'),
47         # "code.google.com will be soon switching down, perhaps it moved to github.com?"),
48     ],
49     'Repo': [
50         (re.compile(r'.*[^sS]://dl\.google\.com/.*'),
51          "dl.google.com URLs should always use https:// not http://"),
52         (re.compile(r'.*[^sS]://github\.com/.*'),
53          "github URLs should always use https:// (not http://, git://, or git@)"),
54         (re.compile(r'.*[^sS]://gitorious\.org/.*'),
55          "gitorious URLs should always use https:// (not http://, git://, or git@)"),
56         (re.compile(r'.*[^sS]://[^.]*\.googlecode\.com/svn/?.*'),
57          "Google Code SVN URLs should always use https:// (not http:// or svn://)"),
58         (re.compile(r'.*[^sS]://svn\.apache\.org/repos/?.*'),
59          "Apache SVN URLs should always use https:// (not http:// or svn://)"),
60         (re.compile(r'.*[^sS]://svn\.code\.sf\.net/.*'),
61          "Sourceforge SVN URLs should always use https:// (not http:// or svn://)"),
62         # TODO enable in August 2015, when Google Code goes read-only
63         # (re.compile(r'.*://code\.google\.com/.*'),
64         # "code.google.com will be soon switching down, perhaps it moved to github.com?"),
65     ],
66     'Issue Tracker': [
67         (re.compile(r'.*github\.com/[^/]+/[^/]+[/]*$'),
68          "/issues is missing"),
69         (re.compile(r'.*[^sS]://github\.com/.*'),
70          "github URLs should always use https:// not http://"),
71         (re.compile(r'.*[^sS]://gitorious\.org/.*'),
72          "gitorious URLs should always use https:// not http://"),
73         # TODO enable in August 2015, when Google Code goes read-only
74         # (re.compile(r'.*://code\.google\.com/.*'),
75         # "code.google.com will be soon switching down, perhaps it moved to github.com?"),
76     ],
77     'License': [
78         (re.compile(r'^(|None|Unknown)$'),
79          "No license specified"),
80     ],
81     'Summary': [
82         (re.compile(r'^$'),
83          "Summary yet to be filled"),
84         (re.compile(r'.*\b(free software|open source)\b.*', re.IGNORECASE),
85          "No need to specify that the app is Free Software"),
86         (re.compile(r'.*((your|for).*android|android.*(app|device|client|port|version))', re.IGNORECASE),
87          "No need to specify that the app is for Android"),
88     ],
89     'Description': [
90         (re.compile(r'^No description available$'),
91          "Description yet to be filled"),
92         (re.compile(r'\s*[*#][^ .]'),
93          "Invalid bulleted list"),
94         (re.compile(r'^\s'),
95          "Unnecessary leading space"),
96         (re.compile(r'.*\s$'),
97          "Unnecessary trailing space"),
98     ],
99 }
100
101 regex_pedantic = {
102     'Web Site': [
103         (re.compile(r'.*github\.com/[^/]+/[^/]+\.git'),
104          "Appending .git is not necessary"),
105     ],
106     'Source Code': [
107         (re.compile(r'.*github\.com/[^/]+/[^/]+\.git'),
108          "Appending .git is not necessary"),
109     ],
110     'Repo': [
111         (re.compile(r'^http://.*'),
112          "use https:// if available"),
113         (re.compile(r'^svn://.*'),
114          "use https:// if available"),
115     ],
116     'Issue Tracker': [
117         (re.compile(r'.*github\.com/[^/]+/[^/]+/issues/.*'),
118          "/issues is often enough on its own"),
119     ],
120     'Summary': [
121         (re.compile(r'.*[a-z0-9][.!?][ $]'),
122          "Punctuation should be avoided"),
123     ],
124 }
125
126
127 def main():
128
129     global config, options, curid, count
130     curid = None
131
132     count = Counter()
133
134     def warn(message):
135         global curid, count
136         if curid:
137             print "%s:" % curid
138             curid = None
139             count['app'] += 1
140         print '    %s' % message
141         count['warn'] += 1
142
143     def pwarn(message):
144         if options.pedantic:
145             warn(message)
146
147     # Parse command line...
148     parser = OptionParser(usage="Usage: %prog [options] [APPID [APPID ...]]")
149     parser.add_option("-v", "--verbose", action="store_true", default=False,
150                       help="Spew out even more information than normal")
151     parser.add_option("-q", "--quiet", action="store_true", default=False,
152                       help="Restrict output to warnings and errors")
153     parser.add_option("-p", "--pedantic", action="store_true", default=False,
154                       help="Show pedantic warnings that might give false positives")
155     (options, args) = parser.parse_args()
156
157     config = common.read_config(options)
158
159     # Get all apps...
160     allapps = metadata.read_metadata(xref=False)
161     apps = common.read_app_args(args, allapps, False)
162
163     for appid, app in apps.iteritems():
164         if app['Disabled']:
165             continue
166
167         curid = appid
168         count['app_total'] += 1
169
170         curbuild = None
171         for build in app['builds']:
172             if not curbuild or int(build['vercode']) > int(curbuild['vercode']):
173                 curbuild = build
174
175         # Potentially incorrect UCM
176         if (curbuild and curbuild['commit']
177                 and app['Update Check Mode'] == 'RepoManifest'
178                 and curbuild['commit'] != 'unknown - see disabled'
179                 and any(s in curbuild['commit'] for s in '.,_-/')):
180             pwarn("Last used commit '%s' looks like a tag, but Update Check Mode is '%s'" % (
181                 curbuild['commit'], app['Update Check Mode']))
182
183         # Dangerous auto updates
184         if curbuild and app['Auto Update Mode'] != 'None':
185             for flag in ['target', 'srclibs', 'scanignore']:
186                 if curbuild[flag]:
187                     pwarn("Auto Update Mode is enabled but '%s' is manually set at '%s'" % (flag, curbuild[flag]))
188
189         # Summary size limit
190         summ_chars = len(app['Summary'])
191         if summ_chars > config['char_limits']['Summary']:
192             warn("Summary of length %s is over the %i char limit" % (
193                 summ_chars, config['char_limits']['Summary']))
194
195         # Redundant info
196         if app['Web Site'] and app['Source Code']:
197             if app['Web Site'].lower() == app['Source Code'].lower():
198                 warn("Website '%s' is just the app's source code link" % app['Web Site'])
199
200         # "None" still a category
201         if 'None' in app['Categories']:
202             warn("Category 'None' is is still present")
203         elif not app['Categories']:
204             warn("Categories are not set")
205
206         name = app['Name'] or app['Auto Name']
207         if app['Summary'] and name:
208             if app['Summary'].lower() == name.lower():
209                 warn("Summary '%s' is just the app's name" % app['Summary'])
210
211         desc = app['Description']
212         if app['Summary'] and desc and len(desc) == 1:
213             if app['Summary'].lower() == desc[0].lower():
214                 warn("Description '%s' is just the app's summary" % app['Summary'])
215
216         # Description size limit
217         desc_charcount = sum(len(l) for l in desc)
218         if desc_charcount > config['char_limits']['Description']:
219             warn("Description of length %s is over the %i char limit" % (
220                 desc_charcount, config['char_limits']['Description']))
221
222         if (not desc[0] or not desc[-1]
223                 or any(not desc[l - 1] and not desc[l] for l in range(1, len(desc)))):
224             warn("Description has an extra empty line")
225
226         # Regex checks in all kinds of fields
227         for f in regex_warnings:
228             for m, r in regex_warnings[f]:
229                 t = metadata.metafieldtype(f)
230                 if t == 'string':
231                     if m.match(app[f]):
232                         warn("%s '%s': %s" % (f, app[f], r))
233                 elif t == 'multiline':
234                     for l in app[f]:
235                         if m.match(l):
236                             warn("%s at line '%s': %s" % (f, l, r))
237
238         # Regex pedantic checks in all kinds of fields
239         if options.pedantic:
240             for f in regex_pedantic:
241                 for m, r in regex_pedantic[f]:
242                     if m.match(app[f]):
243                         warn("%s '%s': %s" % (f, app[f], r))
244
245         # Build warnings
246         for build in app['builds']:
247             if build['disable']:
248                 continue
249             for s in ['master', 'origin', 'HEAD', 'default', 'trunk']:
250                 if build['commit'] and build['commit'].startswith(s):
251                     warn("Branch '%s' used as commit in build '%s'" % (
252                         s, build['version']))
253                 for srclib in build['srclibs']:
254                     ref = srclib.split('@')[1].split('/')[0]
255                     if ref.startswith(s):
256                         warn("Branch '%s' used as commit in srclib '%s'" % (
257                             s, srclib))
258             for s in ['git clone', 'git svn clone', 'svn checkout', 'svn co', 'hg clone']:
259                 for flag in ['init', 'prebuild', 'build']:
260                     if not build[flag]:
261                         continue
262                     if s in build[flag]:
263                         # TODO: This should not be pedantic!
264                         pwarn("'%s' used in %s '%s'" % (s, flag, build[flag]))
265
266         if not curid:
267             print
268
269     logging.info("Found a total of %i warnings in %i apps out of %i total." % (
270         count['warn'], count['app'], count['app_total']))
271
272 if __name__ == "__main__":
273     main()